Без рубрики

Penukar binari ↔ teks — UTF-8 dan ASCII

Tukar teks ke binari dan binari ke teks dalam pelayar, dengan pilihan UTF-8 atau ASCII serta pengumpulan bit.

Teks untuk ditukar

Pengekodan

Pengumpulan bit

Pemisah

Aksara: 4 Bait UTF-8: 4 Panjang output: 35

Output binari

01001000 01100101 01101100 01101111

Rujukan pantas: aksara ASCII biasa dalam binari 8-bit
Aksara	Perpuluhan	Binari (8 bit)
A	65	01000001
Z	90	01011010
a	97	01100001
z	122	01111010
0	48	00110000
9	57	00111001
(ruang)	32	00100000
!	33	00100001
?	63	00111111
(baris baru)	10	00001010

Soalan lazim

Bagaimana penukaran teks ke binari berfungsi?

Setiap aksara dalam teks mempunyai kod berangka (code point). Untuk aksara ASCII, kod muat dalam 7 bit dan ditambah satu sifar di hadapan supaya menjadi 8 bit. Aksara A ialah kod 65, iaitu 01000001 dalam binari. Penukar membaca setiap aksara, mencari kodnya, dan menulis perwakilan binari bait demi bait.

Apa beza ASCII dan UTF-8?

ASCII merangkumi 128 aksara (huruf Inggeris, angka, tanda baca) dan menggunakan satu bait 7-bit setiap aksara. ISO-8859-1 melanjutkannya kepada 256 aksara. UTF-8 pula pengekodan panjang berubah yang mengendalikan setiap aksara di dunia — Latin, Jawi, Cina, Arab, emoji — menggunakan satu hingga empat bait setiap aksara. Aksara ASCII serupa dalam UTF-8 (satu bait); aksara bukan ASCII mengambil 2-4 bait. Untuk teks Melayu standard, UTF-8 dan ASCII memberi hasil yang sama kerana huruf Melayu adalah ASCII.

Kenapa input binari saya gagal dinyahkod?

Sebab biasa: (1) kumpulan bit bukan 8 (atau 7) bit setiap satu — periksa tiada ruang berlebihan; (2) wujud aksara selain 0 dan 1 (huruf, koma, tab); (3) binari mewakili urutan UTF-8 tidak lengkap. Penyahkod akan melaporkan kedudukan ralat pertama supaya anda boleh membetulkannya. Jika input tiada pemisah langsung, tetapkan "Pengumpulan bit" kepada 8 dan "Pemisah" kepada Tiada.

Berapa bit setiap aksara yang patut digunakan?

Konvensyen standard ialah 8 bit setiap bait. ASCII tulen muat dalam 7 bit, tetapi data simpanan dan protokol rangkaian sentiasa menambah kepada 8. Gunakan 7-bit hanya semasa bekerja dengan protokol teletaip lama atau latihan kuliah Sains Komputer di UM, UKM, atau USM. Aksara bukan ASCII (Cina, Arab Jawi, emoji) memerlukan UTF-8 berbilang bait, jadi pengumpulan 7-bit tidak terpakai untuk mereka.

Bolehkah saya tukar teks Melayu atau emoji?

Ya — pastikan pengekodan ditetapkan kepada UTF-8. Aksara Melayu standard (a-z, A-Z) adalah ASCII, jadi setiap satu hanya satu bait. Aksara Jawi seperti ا mengambil dua bait dalam UTF-8. Aksara CJK (Cina, Jepun, Korea) tiga bait. Emoji seperti 😀 biasanya empat bait UTF-8 — contohnya 11110000 10011111 10011000 10000000. Mod ASCII akan menolak sebarang aksara di luar julat 0-127 dengan mesej ralat.

Adakah binari sama dengan kod mesin?

Tidak. Binari hanyalah asas berangka — asas 2 — yang menggunakan dua digit, 0 dan 1. Kod mesin pula perwakilan binari bagi arahan CPU, iaitu pengekodan khusus untuk pemproses tertentu (x86, ARM, RISC-V). Binari yang anda lihat di sini ialah teks yang dikodkan sebagai bait, bukan arahan boleh laksana. Kedua-duanya menggunakan 0 dan 1, sebab itu istilah "binari" sering disalah ertikan dalam perbualan harian sebagai sinonim "kod komputer".

Bagaimana menukar binari kembali ke teks?

Tukar kepada tab Binari → Teks dan tampal binari anda. Penyahkod memisahkan input mengikut pemisah (lalai: ruang) menjadi bait, menukar setiap kumpulan dari asas 2 kepada code point perpuluhan, kemudian menyusun hasil. Untuk UTF-8, ia mencantumkan urutan berbilang bait kembali menjadi satu aksara dengan betul, contohnya 4 bait emoji menjadi satu simbol.

Semua penukaran berlaku dalam pelayar anda. Tiada apa yang dimuat naik.

Alat ini menukar teks kepada binari dan sebaliknya secara terus dalam pelayar anda. Dua mod tersedia: Teks → Binari mengekod setiap aksara mengikut code point, manakala Binari → Teks menyahkod kumpulan bit kembali kepada aksara. Anda boleh memilih pengekodan UTF-8 (sokongan setiap bahasa, termasuk Jawi dan emoji) atau ASCII tulen 7-bit, mengubah pengumpulan bit (8, 7, atau tanpa pemisah), dan menetapkan pemisah output (ruang, sengkang, paip, atau tiada). Contoh: huruf Melayu “A” menjadi 01000001 (kod ASCII 65); emoji 😀 mengambil empat bait UTF-8. Sesuai untuk pelajar Sains Komputer di UM, UKM, USM, peserta bootcamp pengaturcaraan, atau sesiapa yang mengkaji pengekodan aksara dan protokol rangkaian. Statistik bilangan aksara, bait UTF-8, dan panjang output dipaparkan secara langsung.

Soalan lazim

ARTIKEL BERKAITANLEBIH DARI PENGARANG

Kalkulator Diskaun

Kalkulator Pembundaran Nombor

Kalkulator perubahan peratus

ARTIKEL BERKAITAN LEBIH DARI PENGARANG