Ця стаття є дзеркальною статтею машинного перекладу, будь ласка, натисніть тут, щоб перейти до оригінальної статті.

Вид: 48991|Відповідь: 3

[Джерело] .NET/C#, щоб визначити, чи включено тег BOM

[Копіювати посилання]
Опубліковано 16.07.2021 13:22:54 | | | |
Що таке BOM?

Мітка порядку байтів (BOM), або позначка порядку байтів, — це спеціальна мітка, яка вставляється у файл Unicode, закодований UTF-8, UTF16 або UTF-32, щоб ідентифікувати тип кодування файлу Unicode. Для UTF-8 BOM не потрібен, оскільки він використовується для позначення типу кодування та порядку байтів (big-endian або little-endian) багатобайтового закодованого файлу. У UTF-8 кількість бітів, закодованих для кожного символу, виражається першим байтом, і немає різниці між big-endian і little-endian.
UTF-8 не потребує BOM, хоча стандарт Unicode дозволяє використовувати BOM у UTF-8. Тому UTF-8 без BOM є стандартною формою, і Microsoft здебільшого звикла розміщувати BOM у файлі UTF-8 (до речі: Microsoft також звично називати UTF-16 з BOM «Unicode» без вдачі).
BOM готуються для UTF-16 і UTF-32 для позначення порядку байтів. Microsoft використовує BOM у UTF-8, оскільки він дозволяє чітко розрізняти кодування UTF-8 і ASCII, інакше відкриття CSV-файлу в Excel може бути спотворено. Але такий файл може спричиняти проблеми в інших операційних системах, окрім Windows.
Різниця між «UTF-8» і «UTF-8 з BOM» полягає в тому, чи існує BOM чи ні. Тобто, чи є U+FEFF на початку файлу.
Веб-код UTF-8 не повинен використовувати BOM, інакше помилки трапляються часто. При виведенні CSV-файлу з http-відповіді він за замовчуванням не додається при встановленні utf8
BOM, але Windows Excel використовує BOM для підтвердження кодування UTF8, і всім потрібно записати BOM на початку файлу.



Коли ви вперше розробляєте генератор коду на Java, ви додаєте файл безпосередньоЗапишіть у файл UTF-8, який містить тег BOMЦе призведе до помилок пакування, а саме:

Нелегальні символи: '\ufeff'


Як використати .NET / C#, щоб визначити, чи містить файл теги BOM? , код виглядає так:





Колеги, прикріпленіКонвертує формат BOM UTF-8 у формат UTF-8 (без тегів BOM), повний код виглядає так:

(Кінець)

Забити

Кількість учасників1МБ+1 Сприяють+1 Колапс причина
Мо Фен 123 + 1 + 1 Дуже потужно!

Переглянути всі рейтинги





Попередній:SQL SERVER видаляє функцію видалення розділів і схему розділів
Наступний:Площа кожної таблиці в базі даних SQL Server
Опубліковано 16.07.2021 22:41:40 |
 Орендодавець| Опубліковано 01.11.2024 15:00:47 |
UTF-8 видаляє тег BOM

 Орендодавець| Опубліковано 25.06.2025 16:13:03 |
UTF-8 не записує у BOM
Застереження:
Усе програмне забезпечення, програмні матеріали або статті, опубліковані Code Farmer Network, призначені лише для навчання та досліджень; Вищезазначений контент не повинен використовуватися в комерційних чи незаконних цілях, інакше користувачі несуть усі наслідки. Інформація на цьому сайті надходить з Інтернету, і спори щодо авторських прав не мають до цього сайту. Ви повинні повністю видалити вищезазначений контент зі свого комп'ютера протягом 24 годин після завантаження. Якщо вам подобається програма, будь ласка, підтримуйте справжнє програмне забезпечення, купуйте реєстрацію та отримайте кращі справжні послуги. Якщо є будь-яке порушення, будь ласка, зв'яжіться з нами електронною поштою.

Mail To:help@itsvse.com