본문 바로가기
Java

문자열 한글, 일어, 한자 등 포함 여부 찾기

by 전재훈 2019. 12. 30.
반응형

 

String content = "전全재宰훈勳い!";

int contentByte = 0;
for(int i=0 ; i < content.length() ; i++) {

 

}String content = "한글全い!";

for(int i=0 ; i < content.length() ; i++) {
    if ( content.charAt(i) >= '\uAC00' && content.charAt(i) <= '\uD7A3' ) {
    System.out.print("한글 : ");
} else if ( content.charAt(i) >= '\u2E80' && content.charAt(i) <= '\u2EFF' ) {
System.out.print("한자부수 : ");
} else if ( content.charAt(i) >= '\u3400' && content.charAt(i) <= '\u4DB5' ) {
System.out.print("한자확장A : ");
} else if ( content.charAt(i) >= '\u4E00' && content.charAt(i) <= '\u9FFF' ) {
System.out.print("한중일공통한자 : ");
} else if ( content.charAt(i) >= '\u3040' && content.charAt(i) <= '\u309F' ) {
System.out.print("히라가나 : ");
} else if ( content.charAt(i) >= '\u30A0' && content.charAt(i) <= '\u30FF' ) {
System.out.print("카타카나 : ");
} else {
System.out.print("기타 : ");
}
}

 

 

유니코드 3.1에 정의된 언어 영역 (List of block names for Unicode Standard 3.1)

 범위  언어  설명

 0000..007F  Basic Latin  기본 라틴(영어 알파벳)

 0080..00FF  Latin-1 Supplement  

 0100..017F  Latin Extended-A  

 0180..024F  Latin Extended-B  

 0250..02AF  IPA Extensions  

 02B0..02FF  Spacing Modifier Letters  

 0300..036F  Combining Diacritical Marks  

 0370..03FF  Greek  그리스어

 0400..04FF  Cyrillic  키릴어

 0530..058F  Armenian  아르메니아어

 0590..05FF  Hebrew  히브리어

 0600..06FF  Arabic  아랍어

 0700..074F  Syriac  시리아어

 0780..07BF  Thaana  

 0900..097F  Devanagari  

 0980..09FF  Bengali  벵골어(인도)

 0A00..0A7F  Gurmukhi  

 0A80..0AFF  Gujarati  

 0B00..0B7F  Oriya  

 0B80..0BFF  Tamil  

 0C00..0C7F  Telugu  

 0C80..0CFF  Kannada  

 0D00..0D7F  Malayalam  

 0D80..0DFF  Sinhala  

 0E00..0E7F  Thai  

 0E80..0EFF  Lao  

 0F00..0FFF  Tibetan  

 1000..109F  Myanmar  

 10A0..10FF  Georgian  

 1100..11FF  Hangul Jamo  한글 자모

 1200..137F  Ethiopic  

 13A0..13FF  Cherokee  

 1400..167F  Unified Canadian Aboriginal Syllabics  

 1680..169F  Ogham  

 16A0..16FF  Runic  

 1780..17FF  Khmer  

 1800..18AF  Mongolian  몽고어

 1E00..1EFF  Latin Extended Additional  

 1F00..1FFF  Greek Extended  

 2000..206F  General Punctuation  

 2070..209F  Superscripts and Subscripts  

 20A0..20CF  Currency Symbols  

 20D0..20FF  Combining Marks for Symbols  

 2100..214F  Letterlike Symbols  

 2150..218F  Number Forms  

 2190..21FF  Arrows  

 2200..22FF  Mathematical Operators  

 2300..23FF  Miscellaneous Technical  

 2400..243F  Control Pictures  

 2440..245F  Optical Character Recognition  

 2460..24FF  Enclosed Alphanumerics  

 2500..257F  Box Drawing  

 2580..259F  Block Elements  

 25A0..25FF  Geometric Shapes  

 2600..26FF  Miscellaneous Symbols  

 2700..27BF  Dingbats  

 2800..28FF  Braille Patterns  

 2E80..2EFF  CJK Radicals Supplement  한자 부수

 2F00..2FDF  Kangxi Radicals  강희자전 부수

 2FF0..2FFF  Ideographic Description Characters  

 3000..303F  CJK Symbols and Punctuation  

 3040..309F  Hiragana  일본어 히라가나

 30A0..30FF  Katakana  일본어 카타카나

 3100..312F  Bopomofo  

 3130..318F  Hangul Compatibility Jamo  한글 호환 자모

 3190..319F  Kanbun  

 31A0..31BF  Bopomofo Extended  

 3200..32FF  Enclosed CJK Letters and Months  원문자

 3300..33FF  CJK Compatibility  한중일 호환

 3400..4DB5  CJK Unified Ideographs Extension A  한자 확장 A

 4E00..9FFF  CJK Unified Ideographs  한중일 공통 한자

 A000..A48F  Yi Syllables  

 A490..A4CF  Yi Radicals  

 AC00..D7A3  Hangul Syllables  한글

 D800..DB7F  High Surrogates  상위대행코드

 DB80..DBFF  High Private Use Surrogates  Private Use용의 15,16 Plane 지정을 위한 상위대행코드

 DC00..DFFF  Low Surrogates  하위대행코드

 E000..F8FF  Private Use  

 F900..FAFF  CJK Compatibility Ideographs  한중일 호환

 FB00..FB4F  Alphabetic Presentation Forms  

 FB50..FDFF  Arabic Presentation Forms-A  

 FE20..FE2F  Combining Half Marks  

 FE30..FE4F  CJK Compatibility Forms  

 FE50..FE6F  Small Form Variants  

 FE70..FEFE  Arabic Presentation Forms-B  

 FEFF..FEFF  Specials  

 FF00..FFEF  Halfwidth and Fullwidth Forms  

 FFF0..FFFD  Specials  

 10300..1032F  Old Italic  

 10330..1034F  Gothic  

 10400..1044F  Deseret  

 1D000..1D0FF  Byzantine Musical Symbols  

 1D100..1D1FF  Musical Symbols  음표

 1D400..1D7FF  Mathematical Alphanumeric Symbols  

 20000..2A6D6  CJK Unified Ideographs Extension B  한자 확장 B

 2F800..2FA1F  CJK Compatibility Ideographs Supplement  

 E0000..E007F  Tags  

 F0000..FFFFD  Private Use  개인 사용 목적(언어판 15)

 100000..10FFFD  Private Use  개인 사용 목적(언어판 16)

반응형

댓글