Главная Настройка Mobile Контакты NSFW Каталог Пожертвования Купить пасскод Pics Adult Pics API Архив Реквест доски Каталог стикеров Реклама
Доски


[Ответить в тред] Ответить в тред

Check this out!

[Назад][Обновить тред][Вниз][Каталог] [ Автообновление ] 19 | 1 | 4
Назад Вниз Каталог Обновить

Аноним 20/10/17 Птн 17:50:18  163331164  
JLhIxA-zHPs.jpg (188Кб, 912x936)
Блять, двач, вообще нихуя не понимаю, выручай!
Допустим, есть у меня двоичная последовательность: 11010001 10000010, это D182 в hex, соответственно пара символов в utf-8 с hex кодом d1 и 82, а теперь смотри пикрилейтед, почему бляцкий hex в utf-16 другой, при том же двоичном коде, что за хуйня, анон, уже второй час гуглю, нихуя не могу понять. Полыхает.
Аноним 20/10/17 Птн 17:50:51  163331202
И сразу тактический бамп
Аноним 20/10/17 Птн 17:53:04  163331392
Еще бамп
Аноним 20/10/17 Птн 17:54:48  163331534
Бампецкий
Аноним 20/10/17 Птн 17:55:42  163331601
Анон, выручай
Аноним 20/10/17 Птн 17:56:46  163331669
Я мог бы еще понять, если бы не совпадали только первые 2 цифры в hex, мол, первые 8 бит считываются по другому, но вторые 8 бит-то тут при чем?
Аноним 20/10/17 Птн 17:59:19  163331839
Бамп!
Аноним 20/10/17 Птн 18:08:26  163332512
Зачем тебе?
Аноним 20/10/17 Птн 18:10:42  163332696
>>163332512
Случайно обнаружил, не могу понять, и теперь пердак горит от того, что не понимаю.
Аноним 20/10/17 Птн 18:14:54  163333051
>>163331164 (OP)
Потому что utf-8 и utf-16 разные кодировки на одном наборе символов. У utf-8 число байтов на символ динамическое, а у utf-16 всегда 2 байта или 2 группы по 2 байта, если символ большой.
Аноним 20/10/17 Птн 18:37:11  163334569
>>163332696
Хз, антош.
Из вики утф16:
>Символы Unicode до 0xFFFF включительно (исключая диапазон для суррогатов) записываются как есть 16-битным словом.
>диапазон 0xD800..0xDFFF используется как раз для кодирования так называемых суррогатных пар — символов, которые кодируются двумя 16-битными словами.
Но твой символ (0хD182) не является суррогатным, а значит должен быть как есть.
Аноним 20/10/17 Птн 18:38:22  163334635
>>163334569
Именно, поэтому я и не понимаю нихуя_, почему они не совпадают.
Аноним 20/10/17 Птн 18:47:46  163335248
https://ru.m.wikipedia.org/wiki/UTF-8
Почитай принцип кодирования
Номер т в юникоде -- 0х0442 и в utf-16 он так и пишется
В утф-8 просто хитрожопо кодируется все, так что байты не должны совпадать
Аноним 20/10/17 Птн 18:59:20  163335982
ОП, ты тут?
Аноним 20/10/17 Птн 19:34:59  163338170
>>163335248
Я и не сомневаюсь, что он так и пишется, но тут точно не в утф8 проблема, статьи на вики я в первую очередь все прочитал.
Вопрос в том, что хекс утф8 совпадает с простым переводом из двоичного в хекс, а у утф16 не совпадает.

>>163335982
Да, пока отвлекся ненадолго
Аноним 20/10/17 Птн 20:10:00  163340299
>>163338170
Я не понял, в чем вопрос. У тебя номер символа -- 0442 в шестнадцатеричной (00000100 01000010 в двоичной). В utf-16 он так и пишется двумя байтами -- 0x04 и 0x42. В utf-8 символы кодируются нетривиальным образом, так что там и получается 11010001 10000010 (в соответствии со схемой из википедии), то есть те самые два байта -- 0xD1 и 0x82.
Аноним 20/10/17 Птн 20:16:14  163340651
>>163340299
Все наоборот, у меня есть бинарная последовательность 11010001 10000010, в хекс - d182, это бинарный код для буквы "т", в утф8 - это пара d1 82, а в утф16 - это 04 42, при том же самом бинарном коде.ю вот я и не понимаю нихуя
Аноним 20/10/17 Птн 20:19:25  163340842
>>163340651
>11010001 10000010, в хекс - d182, это бинарный код для буквы "т",
Ошибка здесь
>Номер т в юникоде -- 0х0442
Аноним 20/10/17 Птн 20:25:17  163341207
>>163340842
А, тогда понятно, это не хекс представление в утф16, а лишь номер буквы,спасибо, анон
Аноним 20/10/17 Птн 20:35:25  163341763
>>163341207
Ну впрочем они совпадают.

[Назад][Обновить тред][Вверх][Каталог] [Реквест разбана] [Подписаться на тред] [ ] 19 | 1 | 4
Назад Вверх Каталог Обновить

Топ тредов
Избранное