A quick thought on the compressability of language.

Nov 02, 2006 11:32



עברית, הרגילה לכתיבה בכתב חסר, מתאימה הרבה יותר לסגנון הכתיבה ה-SMSי המתוקצר. אפשר להביע יותר בפחות אותיות. קיצוץ התנועות באנגלית צורם הרבה יותר.

מצד שני, האם השימוש הנרחב ב-vowels באנגלית משפר את יכולת הכיווץ ע"י אלגוריתמי כיווץ כאלה ואחרים?

language, geeking

Leave a comment

Comments 3

passacaglio November 2 2006, 14:16:40 UTC
A few weeks ago we were playing Hebrew scrabble and noticed how much easier it is in the holy language then in english. Mainly, we discussed the fact that most two letter combinations in hebrew are actual words in the language, whereas english does not have this trait (except google searching english).

Reply


anonymous November 5 2006, 10:10:55 UTC
Ironically enough, Hebrew SMS's are restricted to 70 characters, while English ones can be twice as long. There is no storage/programming logic to this, except perhaps the inability of foreign manufactured mobile phones to decipher/display hebrew text, at which case the extra 70 characters serve as some sort of 'mask' or codec.
Actually, that's a silly idea, even for Israeli cellular companies.
So why the hell are Hebrew SMS's thus shortened?

Avshi.

Reply


נו באמת! anonymous December 2 2006, 11:54:00 UTC
איזה מין מדעניות זאת? אני אגיד אותך למרק ליברמן! כמה זה כבר קשה לקחת מדגם מייצג של טקסטים בעברית ואנגלית באותו אורך ולבדוק מדעית את ההבדלים בכיווץ?!

ולגבי האורך של ה-SMS, הניחוש שלי הוא ש-SMS בעברית הולך ביוניקוד מאיזשו סוג, ולכן אנחנו מקבלים בערך חצי באורך. למישהו יש נסיון עם רוסית?! ערבית?.

ד.

Reply


Leave a comment

Up