iconv ๋ช ๋ น์ด
iconv
์ด ๋ช ๋ น์ด๋ ํ์ผ์ ์ธ์ฝ๋ฉ์ ๋ณํํ๋ ๋ฐ ์ฌ์ฉ๋๋ค. ์๋ฅผ ๋ค์ด, ํ๊ธ ํ์ผ์ด EUC-KR๋ก ์ธ์ฝ๋ฉ๋์ด ์์ ๋, ์ด๋ฅผ UTF-8๋ก ๋ณํํ์ฌ ๋ค๋ฅธ ์์คํ ์ด๋ ์ ํ๋ฆฌ์ผ์ด์ ์์๋ ์ฝ์ ์ ์๋๋ก ํ ์ ์๋ค. ์ฃผ๋ก ๋ฆฌ๋ ์ค์ ์ ๋์ค ๊ณ์ด ์ด์ ์ฒด์ ์์ ์ฌ์ฉ๋๋ค.
๊ธฐ๋ณธ ๊ตฌ๋ฌธ
iconv -f <์๋ณธ ์ธ์ฝ๋ฉ> -t <๋ณํํ ์ธ์ฝ๋ฉ> <์
๋ ฅ ํ์ผ> -o <์ถ๋ ฅ ํ์ผ>
- -f : ์๋ณธ ํ์ผ์ ์ธ์ฝ๋ฉ์ ์ง์ ํ๋ค.
- -t : ๋ณํํ ์ธ์ฝ๋ฉ์ ์ง์ ํ๋ค.
- <์ ๋ ฅ ํ์ผ> : ์ธ์ฝ๋ฉ์ ๋ณํํ ๋์ ํ์ผ์ด๋ค.
- -o : ๋ณํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ ์ฅํ ํ์ผ์ ์ง์ ํ๋ค.
์์
1. EUC-KR์์ UTF-8๋ก ๋ณํ
iconv -f EUC-KR -t UTF-8 input.txt -o output.txt
- input.txt ํ์ผ์ EUC-KR์์ UTF-8๋ก ๋ณํํ๊ณ , ๊ฒฐ๊ณผ๋ฅผ output.txt์ ์ ์ฅํ๋ค.
2. UTF-16์์ UTF-8๋ก ๋ณํ ํ ํ์ค ์ถ๋ ฅ์ ํ์
iconv -f UTF-16 -t UTF-8 input.txt
- input.txt ํ์ผ์ UTF-16์์ UTF-8๋ก ๋ณํํ๊ณ ๊ฒฐ๊ณผ๋ฅผ ํ์ค ์ถ๋ ฅ(ํฐ๋ฏธ๋)์ ํ์ํ๋ค.
3. EUC-KR๋ก ์ธ์ฝ๋ฉ๋ input.csv ํ์ผ์ UTF-8๋ก ๋ณํํ๋ ค๋ฉด ๋ค์ ๋ช ๋ น์ด๋ฅผ ์ฌ์ฉํด์ผํ๋ค.(csv ํ์ผ๋ ๊ฐ๋ฅํ๋ค.)
iconv -f EUC-KR -t UTF-8 input.csv -o output.csv
4. ์ฌ๋ฌ ํ์ผ ๋ณํ
- ์ฌ๋ฌ ํ์ผ์ ๋ณํํ ๊ฒฝ์ฐ for ๋ฌธ๊ณผ ํจ๊ป ์ฌ์ฉํ ์ ์๋ค.
for file in *.txt; do
iconv -f EUC-KR -t UTF-8 "$file" -o "utf8_$file"
done
์ธ์ฝ๋ฉ ํ์ธํ๊ธฐ
ํ์ผ์ ์ธ์ฝ๋ฉ์ด ํ์คํ์ง ์๋ค๋ฉด file ๋ช ๋ น์ ์ฌ์ฉํด ํ์ธํ ์ ์๋ค.
file -i <ํ์ผ๋ช
>
'๊ฐ๋ฐ ์ง์, ์คํฌ๋ฆฝํธ > ๋ฆฌ๋ ์ค' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
du์ ls์ ์ฐจ์ด (2) | 2024.11.18 |
---|---|
ํด๋์ ์ ํํ ์๋ฏธ (2) | 2024.09.05 |
๋ฆฌ๋ ์ค์์์ export์ ์๋ฏธ์ bash_profile์ ํ์ฉ (0) | 2024.07.05 |
alias(๋ณ์นญ)๋? (0) | 2024.07.03 |
chmod 755 ~ ์ ์๋ฏธ (0) | 2024.06.26 |
๋๊ธ