Иностранные языки


Ответить в тред Ответить в тред

Check this out!
<<
Назад | Вниз | Каталог | Обновить тред | Автообновление
16 10 7

Новой кодировке трендж Аноним 04/07/19 Чтв 17:36:57 4234841
DKOTI-SU.png (79Кб, 900x496)
900x496
Как известно, уникоду пора в могилу, но что мы можем предложить взамен? У меня есть ахуеннейшее начало великой системы кодирования текста, продуманной до мелочей. Вот плюсы:

1. Более простой механизм мультибайтовой адресации: вместо 11... 10... байты с ведущей единицей идут в начале и середине представления и кодируют страницу, а байт с ведущим нулём - конечный и кодирует символ на странице. Благодаря этому обеспечивается более простая программная реализация.
2. На каждой странице, кроме нулевой, символы только определённого класса (латиница, пунктуация, математика итд)
3. Поддержка кроме двунаправленного письма татегаки и монгольского написания + снизу вверх.
4. Заглавные и строчные алфавиты разделены на разные страницы и идут абсолютно синхронно, делая регулярки и поисковые алгоритмы быстрее некуда.
5. В базовой странице вместо старых как говно мамонта управляющих символов - знак отрицания, бесконечность, параграф, тире и неразрывный пробел, а также весь новый русский алфавит.
6. В этой же базовой странице каждая строка имеет уникальное свойство. Стоит получше рассмотреть таблицу, чтобы убедиться.
Аноним 04/07/19 Чтв 17:37:39 4234852
DKOTI-80.png (45Кб, 900x241)
900x241
DKOTI-81.png (38Кб, 900x240)
900x240
DKOTI-82.png (34Кб, 900x240)
900x240
Вот страницы управляющих символов.
Аноним 04/07/19 Чтв 17:38:25 4234863
controlcharacte[...].png (84Кб, 779x454)
779x454
controlcharacte[...].png (91Кб, 779x516)
779x516
controlcharacte[...].png (101Кб, 827x482)
827x482
controlcharacte[...].png (100Кб, 877x526)
877x526
VN - варианты начертания. А вот расшифровка на трёх языках.
Аноним 04/07/19 Чтв 17:38:50 4234884
controlcharacte[...].png (97Кб, 877x510)
877x510
controlcharacte[...].png (85Кб, 779x513)
779x513
controlcharacte[...].png (87Кб, 779x481)
779x481
controlcharacte[...].png (118Кб, 779x482)
779x482
Вторая часть.
Аноним 04/07/19 Чтв 17:39:29 4234895
controlcharacte[...].png (84Кб, 877x490)
877x490
А это расшифровка управляющих символов базовой страницы.
Аноним 04/07/19 Чтв 17:42:11 4234916
image.png (41Кб, 900x264)
900x264
image.png (41Кб, 900x264)
900x264
image.png (41Кб, 900x264)
900x264
image.png (38Кб, 900x265)
900x265
Латиница разделена на заглавные и строчные, которые идут синхронно друг с другом.
Аноним 04/07/19 Чтв 17:43:26 4234937
image.png (37Кб, 900x264)
900x264
image.png (39Кб, 900x264)
900x264
image.png (34Кб, 900x265)
900x265
image.png (33Кб, 900x268)
900x268
В самой новой 5 страниц занимают заглавные и 5 - строчные. И там дохуя свободных кодовых позиций.
Аноним 04/07/19 Чтв 17:44:58 4234958
image.png (32Кб, 1258x374)
1258x374
image.png (50Кб, 1258x369)
1258x369
image.png (22Кб, 900x265)
900x265
image.png (29Кб, 900x265)
900x265
Вот модификаторы (1,2), надстрочные и подстрочные индексы (3) и валюты (4).
Аноним 04/07/19 Чтв 17:45:49 4234969
image.png (45Кб, 1258x375)
1258x375
image.png (37Кб, 1258x370)
1258x370
image.png (30Кб, 1258x370)
1258x370
А это - комбинируемые диакритические и другие символы.
Аноним 04/07/19 Чтв 17:48:48 42349710
Чего я прошу от вас? Грамотного построения в алфавиты всех символов письменностей, представленных в уникоде. Грамотного - значит так, как они идут в алфавите, а не выкидывать Ё из общего потока. Плюс, когда дойдём до CJK, нужно будет раскидать одни и те же символы с разным написанием в разных языках по этим самым разным языкам.
Аноним 04/07/19 Чтв 21:58:19 42351711
>>423484 (OP)
> F G Ч H I J
> O P Ш Q R S
> X Y Z Э Ю Я
Зачем ты поместил кириллицу среди латиницы? В Юникоде они хотя бы в разных блоках, а у тебя они как попало.

> 2. На каждой странице, кроме нулевой, символы только определённого класса (латиница, пунктуация, математика итд)
Нет же, у тебя они вперемешку.

> а также весь новый русский алфавит
Это как?

> 6. В этой же базовой странице каждая строка имеет уникальное свойство. Стоит получше рассмотреть таблицу, чтобы убедиться.
И какое же?
Аноним 04/07/19 Чтв 22:28:58 42352112
>>423517
> Зачем ты поместил кириллицу среди латиницы? В Юникоде они хотя бы в разных блоках, а у тебя они как попало.
Это латкир, неуч. Новый русский алфавит.

> > 2. На каждой странице, кроме нулевой, символы только определённого класса (латиница, пунктуация, математика итд)
> Нет же, у тебя они вперемешку.
Кроме нулевой, сказано же дауну.

> > а также весь новый русский алфавит
> Это как?
Сракой об косяк. Возвращайся в первый класс и учи латкир.

> > 6. В этой же базовой странице каждая строка имеет уникальное свойство. Стоит получше рассмотреть таблицу, чтобы убедиться.
> И какое же?
1 строка - управляющие символы.
2 строка - цифры + пунктуация, получаемые нажатием цифровых и дополнительных клавиш вместе с shift.
3 строка - пунктуация, получаемая нажатием цифровых и дополнительных клавиш вместе с alt.
4 строка - пунктуация, получаемая нажатием цифровых и дополнительных клавиш.
5, 6 строки - латкир, верхний регистр.
7, 8 строки - латкир, нижний регистр.
Аноним 05/07/19 Птн 01:08:24 42353313
.PNG (176Кб, 937x392)
937x392
>>423521
> Новый русский алфавит
Лол
Аноним 05/07/19 Птн 02:10:35 42353914
>>423484 (OP)
>UNICODE SHOULD COME TO THE GRAVE
Лол. Ты не в курсе, что его обновляют постоянно?
Аноним 05/07/19 Птн 19:18:27 42366015
Итак, первая задача: из всех символов греческого, что есть в уникоде, построить алфавит в алфавитном порядке.
Аноним 11/07/19 Чтв 11:22:56 42457916
УНИКОКОДАУНЫ СОСНУЛИ
Аноним 30/07/19 Втр 00:36:31 42807117
>>423484 (OP)
Ты не слышал про UTF-16? Или как там его звали?
Настройки X
Ответить в тред X
15000 [S]
Макс объем: 40Mб, макс кол-во файлов: 4
Кликни/брось файл/ctrl-v
Стикеры X
Избранное / Топ тредов