개발자들은 한글이 밉다 1. 초성검색편

Рет қаралды 191,188

코딩애플

Күн бұрын

Пікірлер: 641

@codingapple 6 ай бұрын

추가 : new TextEncoder().encode("김") 등 사용해서 utf-8 바이트로 인코딩하면 각 자음모음 쉽게 분리가능합니다

@smartphone784 6 ай бұрын

뭐야 왜 갑자기 댓글이 생겼죠? 항상 영상 잘 보고 있습니다! 감사합니다 :) 제 댓글은 좋아요 누르지 말아주세요

@IllIIllIlIIIlI 3 ай бұрын

영상을 무력화 시키는 댓글 1줄 귀찮게 구현할필요없이 utf8로 바꾸면 된다

@p4rk5h 17 күн бұрын

주인장 대답이 좀.... 잘못 되어서 수정 해드립니다... UTF-8 도 NFC Normalization 쓰면 해당되지 않음 (완성형). NFD Normalization (조합형) 으로 바꿔야 합니다... UTF-8 의 2-byte character representation 이 3바이트를 사용하기 때문에 누가 생각 안 하고 적은 댓글 기반으로 잘못 적은거 같은데.... 아니예요..... 저러면 ASCII Extended Range 에 있는 hex들만 나옵니다. (UTF-8 의 인코딩 특성상 맨 앞 비트를 1로 지정해서 1바이트보다 큰 바이트를 연속해서 표기한다고 명시함) 정확하게 하면 Array.from("김".normalize('NFD')) 정도 되겠네요. 이것도 결론적으로는 누군가 NFC -> NFD 컨버터를 만들어야 하는 상황을 만들었기 때문에.... 손쉽게 바꿀수 있다! 이건 절대 아님. 그리고 Unicode normalization 이게 꽤 부하가 심한 작업이라서.... 그냥 한글은 뭐같은 언어가 맞다!

@묘귀 6 ай бұрын

"한글은 디지털에 최적화된 문자" 이 말 만든 사람한테 보여줘야할 영상

@김도현-d2g 6 ай бұрын

최적화되긴 했네 욕먹기

@성이름-q7j5h 6 ай бұрын

진짜 한글 디지털 최적화설은 어디서 나온건지 모르겠음 ㄹㅇ 뭘 최적화야 물리적으로 용량도 더먹고(알파벳 대비 개수부터가 많으니까) 조합형이니 완성형이니 하며 구현하기도 힘들었는데 그나마 한자보단 낫다고 해도, 결코 최적화된 문자가 아닌데

@neomind9229 6 ай бұрын

이건사실 유니코드라는 문자체계 자체가 아스키의 확장형에 지나지않기 때문에 발생하는일임.. 사실 초/중/종성을 RGB 색상 체계처럼 3차원 데이터로 만들면 이렇게 복잡하게 처리할필요없이 연산이가능한데(물론 그것도 로마자기반 알파벳에비해 불리하긴 하지만).. 코쟁이들이 컴퓨터를 발명했고 코쟁이들한테 굳이 필요가 없었을 뿐임..

@dbckd999 6 ай бұрын

키보드에서 입력하기 편하다는말 아녔나 아님말구

@xizASwojQG 6 ай бұрын

디지털 최적화 된 언어 = 영어 아거 말고 없음

@p_lifp 6 ай бұрын

국립국어원 웹프로젝트 몇 개 담당하고 있는데 썸네일 보자마자 눈물이 왈칵 쏟아졌습니다...

@songbird345 6 ай бұрын

괜찮읎싮늭꽔?

@조준우-d8g 6 ай бұрын

@@songbird345 읽힌다 ㄷㄷㄷㄷ

@모음집만듦 5 ай бұрын

ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

@user-vf3bc1zd3z Ай бұрын

@@songbird345악마야..

@asdasdasd2555 6 ай бұрын

0:06 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 아니고 어미

@개악질 6 ай бұрын

개추 ㅋㅋㅋ

@PastelCoral 6 ай бұрын

어미가 있네

@성이름-q7j5h 6 ай бұрын

종결어미

@hidaQ6 6 ай бұрын

아 ㅋㅋㅋ 뒤에 붙는거면 다 조사라고

@arg9559 6 ай бұрын

html로 프로그래밍하느라 힘드셨나보네요~

@za-mam 6 ай бұрын

es한글을 보니 예전에 tossi라는 라이브러리를 본 기억이 나네요. 그것도 조사 자동으로 맞춰주는 라이브러리였는데... 개발할 때 한글/한국어의 특성은 정말 까다롭고 번거롭네요

@nyaryujin 6 ай бұрын

자연어 처리 공부하다가 왜 이쪽 분야 사람들이 다 미국 가는지 알게됨 시장은 코딱지만한데 난이도만 너무 높음...

@hoyakim4280 6 ай бұрын

한글 폰트 디자인할 때 11,172자를 몽땅 디자인하지 않고요, 샘플 문장을 디자인해 입력하면 그걸 분해해서 나머지 글자를 자동으로 생성하는 프로그램이 있습니다. 한자는 얄짤없고요 ㅎㅎ

@Kallisuma 6 ай бұрын

그나마 다행이네요...ㅋㅋㅋ

@Leo3236 6 ай бұрын

그래서 가끔 특정폰트에서 특정 글자가 잘못 나오군요...

@dbdrl 6 ай бұрын

ㅋㅋㅋㅋㅋ아니 이분 글에서 주인장말투가 느껴져서 뜬금없이 웃김

@JohnBro_world 6 ай бұрын

손글씨 폰트라면 샘플 문장 스캔해서 만들어도, 벡터로 디자인 할때는 1만개 전부는 아니더라도 초•중•종성 모양에 맞는 낱자를 직접 제작하진 않나요?

@arg9559 6 ай бұрын

한자도 조합이 많아서 어느 정도는 할 수 있을 거 같은데 인쁘라가 부족한가보네

@MN-do7hk 6 ай бұрын

0:22 선넘네

@chrisEyeu 6 ай бұрын

설마설마 했는데!!

@스즙 6 ай бұрын

ㄹㅇㅋㅋ 당연히 울트라 아님?

@사랑은기다림이야 6 ай бұрын

ㅋㅋ 일부러 울트라만 가려놨네

@민인-o2x 6 ай бұрын

히라리 뮤라리 히히

@KR_YTlaw80레우 6 ай бұрын

sudo kill @@민인-o2x

@hyeonjaelee1164 6 ай бұрын

VR 한글키보드 만들다 한글 ㅅㅂ를 부르짖었습니다 세종대왕님 죄송합니다 ㅠㅠ 한글을 만든다는게 졸라 빡세구나를 간접적으로 경험해봤습니다

@하늘색고양이-y1l 6 ай бұрын

비슷한 경험을 했군요 ㅋㅋㅋㅋㅋ 게임용 한글 키보드 구현하면서 알파벳 및 알파벳 변형체계인 나라가 부러워 졌습니다

@몽쉘맛바나나 6 ай бұрын

울라리까지는 이해 하겠는데 고글링은 진짜 ㅆ ㅋㅋㅋㅋㅋㅋㅋㅋㅋ

@NANO-bp8lt 6 ай бұрын

할배들 피꺼솟

@이준의-o2h 6 ай бұрын

울라리를 이해한다고?

@sa-lam 6 ай бұрын

걍 울트라 라고 하지 뭘 울라리여 울랄라도 아니고

@mbc-official 5 ай бұрын

@@sa-lam울라리 울트리 울스크

@sa-lam 5 ай бұрын

@@mbc-official 히드라리스크 -> 히드라 / 뮤탈리스크 ->뮤탈 / 울트라리스크 -> 울트라 이렇게 쓰지 않나요?? 나만 이렇게 썼나

@바오-c3p 6 ай бұрын

코딩애플 대머리

@AustineMR90 6 ай бұрын

뻘하게 웃기네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

@포포이 6 ай бұрын

사실적시 명예훼손으로 고소당할 댓글입니다

@MN-do7hk 6 ай бұрын

개추ㅋㅋ

@DieWeltalsWilleundVorstellung 6 ай бұрын

ㅋㄷㅇㅍ ㄷㅁㄹ

@---by4rd 6 ай бұрын

코딩코딩자라나라

@intmain 6 ай бұрын

고1때였나 교과서에 한글은 컴퓨터 프로그램 만드는데 가장 알맞는 문자라고 써놓은거 보고 얼탱이 없었던적 있었음

@gasdebel 6 ай бұрын

ㄹㅇ 희대의 개소리 ㅋㅋ

@Nicks2809 6 ай бұрын

모바일 사용자 입장에서 편하긴 한데 프로그램 만들때는 한자보다는 좋지만 알파벳보다 훨 안좋음

@Erase_China_n_XiJinPing 6 ай бұрын

이거 산업용 장비 만들 때 내가 키보드 기능 구현해서 직접 고생하며 해결하고 겪었던 문제인데 진짜 성가셨음 ㅋㅋㅋ 초성검색부터 해서 다 내가 한것들이네. 저거 모르면 고생하는데 이거 미리 이렇게 보고 배운 사람들은 진짜 무료 지식 편하게 배운거임

@SunnyKimDev 6 ай бұрын

유니티 엔진에서는 폰트 아틀라스 최적화를 위해 게임에서 쓰인 글자(정확히는 글리프, glyph)만 따로 트래킹해서 저장합니다. 개발자가 텍스트 그래픽 등에 텍스트를 입력하면 실시간으로 테이블에 저장하는 등 꽤나 스마트하게 이루어집니다. 문제는 도깨비불 현상으로 인해 작성중에만 쓰이고 실제 완성된 게임에는 포함되지 않는 글자 (예: "니다" 입력 중 "닏") 가 자동으로 게임에서 사용되는 글자로 인식되는 경우가 허다하다는 점입니다. 일본어 중국어 모두 입력 과정에서는 완성된 게임에서도 보통은 쓰이는 히라가나나 영문(한어병음 입력기)를 쓰지만, 입력 과정에서 "닏" "핮" 과 같은 안 쓰이는 요상한 글자를 거치는 언어는 한글이 유일합니다. 일일히 기록에서 드랍시켜야 하고요.

@어서오고-l9q 5 ай бұрын

개발자래서 실컷 비웃어주러 왔다가 글꼴디자인 이야기를 보고 울고감

@jwjwhjdkln 6 ай бұрын

ㄹㅇ 한글이 예전에는 효율적인 문자였지만 정보화 시대에서 효율적이라고 하기엔 힘든 듯.. 물론 최악의 JOAT는 한자고..

@TEPK-2924 6 ай бұрын

0:15 달룟은 뭐야 ㅋㅋㅋㅋㅋ

@Pro_Supporter 6 ай бұрын

아ㅋㅋ 말이 안되도 조합만 된다면 문제 없는거라고 ㅋㅋㅋㅋ

@보플_BoPplle 5 ай бұрын

옵빠달룟

@MERINGUE2 2 ай бұрын

달룟 !!!!

@Postion 27 күн бұрын

달룟!!!!

@zyxwvutsrqpon_lk_ihgfedcba 6 ай бұрын

코딩 이제 안하는데도 이 채널은 계속 봄 ㅋㅋ

@응원주작 5 ай бұрын

경제적 자유를 얻으신건가요 아니면 경제적 체무를 얻으신 건가요?

@Erase_China_n_XiJinPing 3 ай бұрын

@@zyxwvutsrqpon_lk_ihgfedcba 저도 ㅋㅋㅋㅋ

@hwaiyu733 2 ай бұрын

치킨집 차리셨나요?

@andrewnathan629 2 ай бұрын

@@응원주작 둘다 아닐수도 있을듯 걍 단순한 직업변경

@pathfinder1909 3 ай бұрын

1:28 개웃기네 ㅋㅋㅋㅋ

@nyeso 6 ай бұрын

2024년에도 보는사람?

@생각의비밀-q6v 6 ай бұрын

2034년에서 왔습니다

@픩픩픩 6 ай бұрын

ㅋㅋㅋㅋㅋㅋㅋㅋ

@AppleWind 6 ай бұрын

@남똘이 6 ай бұрын

@두노-g5c 6 ай бұрын

오랜만에 보러 왔는데 추억이네요

@smc-susan 6 ай бұрын

진짜 미친건가 ㅋㅋㅋㅋㅋㅋㅋ 다시봐도 한글 디지털 최적화설은 진짜 어떤놈 대가리에서 나온건지

@mlwy1891 5 ай бұрын

뭐 자판 입력에 한해서는 맞는 말이긴 하죠. 옆나라들처럼 한자랑 오십음도 꾸겨넣으려고 영어-변환 작업을 계속 우겨넣는 것보다는 그냥 초중종성 피아노치듯이 나열하는게 편한건 사실이니. 물론 그걸 데이터상으로 모아쓰기하는 것은 프로그래머가 알아서 하시라는게....

@yhpdoit Ай бұрын

사용자의 입장에서 최적화 맞습니다. 초성검색도 영어라면 꿈도 못 꿀 능력이죠.가능성을 검색하는데 글 다 안치고 ㄱㄴㅅ 세번타이핑으로 검색할 수 있는 문자가 어디있습니까? 개발자야 대가리 깨지는 일인데 사용자 입장에선 너무나도 편리한 기능입니다.

@이우철-c6e 6 ай бұрын

유니코드로 뽑은 다음 자음 모음수로 나눠서 나머지값으로 계산하는법이 있었던거 같우데

@morganlefay2600 6 ай бұрын

네 맞아요 초성 비교라면 앞에 비트 몇 개만 비교해주면 됩니다. 영상에 나오겠지 했는데 안나오네요.

@hyunseungyoon3568 4 ай бұрын

나두 유니코드로 해서 해결했는데..

@rnpfqenfv 6 ай бұрын

3:17 사람이름이냐고ㅋㅋㅋㅋㅋㅋㅋㅋㅋ

@NHKimNamo 6 ай бұрын

규식이가 왜 기기서 나와?

@성이름-q7j5h 5 ай бұрын

자매품으로 이동식씨도 있습니다

@Tech-ii9ze 6 ай бұрын

울라리 저거 한창 스타하던 사람들 열받으라고 울라리라고 일부로 쓰는 밈이 있었어요

@acorn-repository 6 ай бұрын

울리가 맞죠 😂

@차차-s5u 6 ай бұрын

울트라 아님?

@두부-z7w 6 ай бұрын

울라리도 몇달동안 보니까 이제 익숙해졌어

@MS-ut4yv 6 ай бұрын

울라리는 처음듣네 ㅋㅋㅋㅋ 나무위키 검색된건 자동으로 울트라리스크로 해석된게 아닌 문서내에 울라리가 있어서가 아닌가?

@셈여림 6 ай бұрын

수컷 울트라리스크가 뭔지 아세요? 사나이 울리는 농심 신라면~ 😂😂😂😂😂😂

@WangJaeLee 6 ай бұрын

ㄹㅇ 당연히 울리인데 ㅋㅋ

@모르-u1r 6 ай бұрын

@@WangJaeLee 뭣

@바니바니 6 ай бұрын

우린 그냥 울트라 라고 부럸는데

@acorn-repository 6 ай бұрын

울리

@mystee-red 6 ай бұрын

개발할 때마다 영어(을)를 모국어로 쓰는 사람(가)이 부러울 때가 많다.

@우이천 6 ай бұрын

난 한글 자동완성 할때 자동["ㅅ"].push("사과"); 자동["사"].push("사과"); 자동["삭"].push("사과"); 자동["사고"].push("사과"); 이런식으로 했음. 당연히 초중종성 분리기만든 뒤에 조합기(심지어 모음끼리의 조합+시프트 조합+등)만들어서 가능한 모든걸 다 키값쌍으로 만들어버림 ㅋㅋㅋㅋ. 성능 개좋아

@귀별 5 ай бұрын

그냥 때려박는게 제일 간단하긴 함 ㅋㅋㅋ

@hardingstudy 5 ай бұрын

아니 성능은 좋겠지 ㅋㅋㅋ 메모리가 장난 아닐듯

@우이천 5 ай бұрын

@@hardingstudy ㄹㅇㅋㅋ 검색할거 많을때는 다른 방법이 좋을듯 함

@chotnt 24 күн бұрын

트라이라는게 있습니다

@집남-m6s 6 ай бұрын

진짜 잘한다 ~ . 옛날에 노가다 했는데 와 ~ .. 이런건 몰랐네 , 역시 치킨집이 내 적성이야 ㅋㅋ

@Nopiyoutube 6 ай бұрын

5:04 죠사 핔컬 개웃기네 ㅅㅂ ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

@qlc7pflqw 6 ай бұрын

조사삐까 ㅋㅋㅋㅋㅋ

@buttering4271 3 ай бұрын

ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

@Ev1004 6 ай бұрын

최근에 엉어를 한글로 입력한 경우 영어로 바꿔주는거 만들려는데 간단해보이는데 생각보다 어렵더라고요... 한글을 실수로 영어로 입력한경우 수정해주는건 라이브러리 많던데

@anvil4884 Ай бұрын

초성검색의 구현방법은 항상 궁금했던 내용이었는데, 재미있게 아주 잘 설명해 주셔서 궁금이 잘 풀렸습니다. 정말 감사합니다. 다른 영상들도 흥미롭네요.

@prussicblack 5 ай бұрын

리눅스에서 한글 쓰려면 뒤저나갑니다..ㅋㅋㅋ nabi 부터 ibus에 fcitx뭐에 뭐에 일일히 테스트 해보고 안되면 아 안되는구나 한글은 포기 하고 쓰기라도 하는데, 어디서는 또 되다가 크롬에서는 안되다가 하면 삽질에 삽질에.... xwindow환경에서는 잘 출력되던게 콘솔로 나오면 ㅁㅁㅁㅁㅁ????? 이러고 있고.. 그러니 한글 지원 잘되는 윈도우를 쓰세용.

@HwanyPlayz 5 ай бұрын

유명한 배포판에선 잘 못들어본것 같은데 navi랑 fcitx같은것도 있었군여

@po_porani 6 ай бұрын

5:25 initial이 있잖아...

@SunnyKimDev 6 ай бұрын

consonant 쪽이 오히려 부정확한 표현입니다. "이웃"의 first/initial consonants는 ㅇㅇ이 아닌 nullㅅ입니다. 초성 ㅇ은 음가가 없어 엄밀히 따지면 consonant이 아니기 때문에 initial consonant도 잘못된 표현이 되는 것입니다.

@HyoyeolLee0324 6 ай бұрын

5:11 뜬금없이 세종대왕 필승코리아 튀어나와서 개터졌네 ㅋㅋㅋㅋㅋㅋ

@watermelon-m3f 6 ай бұрын

알파벳은 시장에서 하나하나 장봐서 요리만드는거라면 한글은 밀키트같은거네요

@조수민-v1k 6 ай бұрын

한글은 양파 쓰려면 스테이크 밀키트에서 고기 버리고 양파만 빼와야함

@yunwoo2611 6 ай бұрын

알파벳은 마트마냥 재료가 하나하나 다 따로 진열되어 있지만 한글은 완성된 요리에서 특정 재료만 추출해야하는느낌?

@marksmithcollins 5 ай бұрын

한국인이 컴퓨터 만들었으면 괜찮다 조합형이면 괜찮다 세벌식이나 한글 전용 키보드면 괜찮다 한국어는 압축되는 언어기 때문에 좋은거라더라 초중종성 개념은 디지털과 몸에 좋다더라 등등 무책임하게 떠드는 인간들은 필수과정으로 한/영/기호 입력/삭제/수정/선택/복잘붙 되는 오토마타를 강제로 만들어보게 해야한다 그래야 그런 쌉소리를 입에 못올림

@AIVIME 6 ай бұрын

울라리

@StealthySakura 6 ай бұрын

뭐? 울라리?

@하품-f5j 6 ай бұрын

미사카 미코토 공부법으로 시험 100점 맞자?

@Kim-ez4yo 6 ай бұрын

울크스

@Aesuh1 6 ай бұрын

2024수능 사회탐구 영역도 올려줘요

@goodiuaiu 6 ай бұрын

영상 만들어와!

@AroU_ 17 күн бұрын

한글이 누가 정보화시대에 유리하다고한지모르겠음.. 폰트만해도 메모리 2~30메가씩 먹어서 알파벳몇개에숫자정도만쓰면되는 영어에 비해 압도적으로 불리해요

@콩쥐팥쥐들쥐 6 ай бұрын

오늘도 원어가 영어인 외국인들이 정밀 부럽다 한국어의 우수성은 모르겠고 그냥 영어가 최고다

@purplehaze7572 6 ай бұрын

대공감하는 이유가 유저한패에도 여러번 참여해보고 기술자분들이 게임 인수분해하던 걸 보며 느낀게 한글도 참 좋긴한데 좋같게 보이더군요 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ

@abe9560 3 ай бұрын

좋고 좋같은 ㅋㅋㅋㅋㅋㅋㅋ

@프라고 6 ай бұрын

토스... 고맙다 잘쓸게...

@stupidcode8853 6 ай бұрын

유니코드 한글 자모(확장 제외) 초성 : ᄀᄁᄂᄃᄄᄅᄆᄇᄈᄉᄊᄋᄌᄍᄎᄏᄐᄑᄒ ᄓᄔᄕᄖᄗᄘᄙᄚᄛᄜᄝᄞᄟᄠᄡᄢᄣᄤᄥ ᄦᄧᄨᄩᄪᄫᄬᄭᄮᄯᄰᄱᄲᄳᄴᄵᄶᄷᄸ ᄹᄺᄻᄼᄽᄾᄿᅀᅁᅂᅃᅄᅅᅆᅇᅈᅉᅊᅋ ᅌᅍᅎᅏᅐᅑᅒᅓᅔᅕᅖᅗᅘᅙᅚᅛᅜᅝᅞ 중성 : ᅡᅢᅣᅤᅥᅦᅧᅨᅩᅪᅫᅬᅭᅮᅯᅰᅱᅲᅳᅴᅵ ᅶᅷᅸᅹᅺᅻᅼᅽᅾᅿᆀᆁᆂᆃᆄᆅᆆᆇᆈᆉᆊ ᆋᆌᆍᆎᆏᆐᆑᆒᆓᆔᆕᆖᆗᆘᆙᆚᆛᆜᆝᆞᆟ ᆠᆡᆢᆣᆤᆥᆦᆧ 종성 : ᆨᆩᆪᆫᆬᆭᆮᆯᆰᆱᆲᆳᆴᆵᆶᆷᆸᆹᆺᆻᆼᆽᆾᆿᇀᇁᇂ ᇃᇄᇅᇆᇇᇈᇉᇊᇋᇌᇍᇎᇏᇐᇑᇒᇓᇔᇕᇖᇗᇘᇙᇚᇛᇜᇝ ᇞᇟᇠᇡᇢᇣᇤᇥᇦᇧᇨᇩᇪᇫᇬᇭᇮᇯᇰᇱᇲᇳᇴᇵᇶᇷᇸ ᇹᇺᇻᇼᇽᇾᇿ ᇯ?

@바굼 5 ай бұрын

ㄹㅇ 디지털상에서 뭐 할때마다 영어 마려움... 검색할때도, 코딩할때도 한글만 끼면 걍 전부 개판됨

@3am778 4 ай бұрын

자연어처리 하는 사람입니다 한글 최고예요 덕분에 먹고살아요 감사합니다 킹갓세종대왕님

@질문빌런-f5i 6 ай бұрын

가장 우수한 문자는 알파벳이 맞다

@미니키-Minyki 6 ай бұрын

그래도... 사랑하시죠..?

@미쳤지 6 ай бұрын

NO. 😊

@Sapiella 3 ай бұрын

나무위키 검색어는 표제어를 메인으로 두고 약어를 모두 병기하는 방식이라 검색엔진에서 약어로도 검색 가능한거..

@stellnya 6 ай бұрын

임베디드에서 한글 쓰려면 대가리가 터짐..... 폰트 어떻게 우겨넣을건데, IME는 왜 내가 만들어야 하는건데

@루티12 6 ай бұрын

지나가던 문과입니다. 자기전에 틀어두기 좋은 영상인거 같아요

@JohnSmith-uk3dk 6 ай бұрын

TMI: 언어학 용어를 빌려와 chosung 대신 onset을 이용할 수 있다 (둘이 완전히 같은 의미는 아니지만)

@마루미르 5 ай бұрын

나는 이 말을 매우 좋아합니다. "사용자가 웃으면, 개발자는 운다."

@月明-c9d 2 ай бұрын

저도 유니티에서 한글 검색 구현해야 해서 고생했는데 마지막에 나오는 함수명 똑같이 지은거 보고 터졌네요 ㅋㅋ

@yee4153 6 ай бұрын

그지같은 LunarDate얘기도 부탁드립니다. 중국이랑 한시간 차이나서 작년 석가탄신일이 하루가 바뀌어버렸죠.

@hmdugi 6 ай бұрын

오~ 필승 코리아 개웃기네 ㅋㅋㅋ 자바스크립트로 키 자판 만들다가 검색하며 배운 것들이 나오니 반갑네요

@MN-do7hk 6 ай бұрын

코딩애플만 기다렸다면 믿어 줄래?

@user-jl3bt4mk1q 6 ай бұрын

콰욱

@vermic_ 6 ай бұрын

쌌지만 또 싼다!

@Kim_Jaeng-jaeng 6 ай бұрын

한글폰트 저작권 걸린다고 난리쳐서 폰트 두개 만들다 뒤질뻔했던거 생각나네요

@youtaek123 6 ай бұрын

와중에 고글링투표한거보소 ㅋㅋㅋㅋㅋㅋㅋㅋ

@aneekumn 6 ай бұрын

욕먹을까봐 뜬금없이 계속 한글 칭찬나오거 개웃기네 ㅋㅋ

@껍질-l1w 5 ай бұрын

나 아싸라 가끔 세종대왕이 원망스러움

@128bit.a 6 ай бұрын

오늘도 너무 멋진 내용 감사하니다. 2부 너무 기...없구나;;

@dart-king 6 ай бұрын

5:12 세종대왕이 한글을 만든 이유:한국어가 한자에 부적합해서 한국어에 적합한 새로운 글자를 만듦.

@mucoshorts 6 ай бұрын

세종대왕도 별표 누른다는 생각은 도대체 어떻게 나오는거냐ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

@chimsil_dev 6 ай бұрын

세종대왕님이 별표찍는다에서 빵터졌네 ㅋㅋㅋㅋㅋㅋ

@jyy4280 6 ай бұрын

자연어 처리하는데 진짜 한글이 골때림 말뭉치 만들어야하는데 변형도 많고 조사도 나눠야하고 높임말그런것도 변환해야되고 갸아아악

@nomizomichani 6 ай бұрын

변형이 많다는 게 무슨 뜻이죠? 어근을 알면 쉽지 않나요? 영어는 불규칙 동사가 많아서 어렵던데... 한국어에도 있긴 하지만... 영어는 단어의 의미가 문장에 다른 어떤 단어가 있는 지에 따라 바뀌어서 좀 복잡해요.

@yong-junjang6681 5 ай бұрын

@@nomizomichani 영어는 고립어라 반대로 말하면 그 백몇개 되는 불규칙만 처리하면 나머진 규칙이 매우 쉬우니 자연어 처리하기도 쉽습니다. 근데 한국어는 규칙이 방대한 교착어에 속하면서도 불규칙도 상당히 많은 언어에 속하는지라.... 당장 '먹다'의 활용만 생각하면 이걸 어떻게 컴퓨터에게 교육시킬지 막막하죠. 반대로 영어는 eat-ate-eaten 3개면 끝날일을요

@고등어-p4i 5 ай бұрын

@@nomizomichani 무겁다 -> 무거워 (ㅂ탈락 불규칙) 푸르다 -> 푸르렀다 (ㄹㄹ불규칙) 파랗다 -> 파랬다 (ㅎ불규칙) 이런 경우에는 무거/워, 푸르/렀다, 파/랬다로 분리하는게 불가능함. 풀어쓰기로 파헤친 다음 알파벳으로 바꿔도 또다른 문제가 생김. 날아[nara], 날라[nalla], 낭아[nang'a] 한국어 원어민들은 의식하지 못하지만, 한국어는 상상 이상으로 표기와 발음이 괴리된 언어임.

@고등어-p4i 5 ай бұрын

@@nomizomichani 예전에 외국인들을 위한 한국어 교습서를 본적이 있는데, 한국어의 숫자체계를 배우는데만 두 챕터를 소모함. 한 자루, 두 마디, 세 그릇 일 분기, 이 센티미터, 삼 리터 한국어는 단위의 종류에 따라 고유어 수사와 한자어 수사를 달리하여 씀. 위의 사례들을 보면 _'순우리말 단위에는 순우리말 숫자를 쓰고, 외래어 단위는 한자어 숫자를 쓰는게 아닌가?'_ 라는 생각이 들 수 있지만 같은 예외도 있음ㅋㅋ

@고등어-p4i 5 ай бұрын

@@nomizomichani 그리고 다른 언어에서는 찾아볼 수 없는 기괴한 문법적 개념들도 많음. 예를 들자면.. A: 지난주는 이 지역에 폭우가 내렸답니다. B: 그렇군요.(O) 그렇네요.(X) A: 지난주는 이 지역에 폭우가 내렸답니다. 저기 보시면 도로가 여전히 잠겨있다 그죠? B: 그렇네요.(O) 그렇군요.(X) '-네'와 '-군'의 구분은 의외성(mirativity)과 증거성(evidentiality)의 유무에 따라 달라짐. 한국어는 화자가 스스로의 감각을 사용해서 받아들인 직접증거와 외부로부터 전해들은 간접증거를 구별하기 때문임. 한국어 원어민은 자유자재로 쓰는 개념이지만 한국어를 제2외국어로 배우는 학습자들은 절대 이해하지 못함.

@youngwongpark6076 6 ай бұрын

울라리로 줄이는거 진짜 int 자료형 최대값 만큼 화나네

@ngh7505 6 ай бұрын

한글 유니코드가 19*21*28 개라서, (문자 - '가') / 28 / 21 하면 바로 초성 인덱스가 나옵니다

@페스로나 17 күн бұрын

0:23 애초에 말줄임이 근본없는건데 그와중에 근본있는 줄임말ㅇㅈㄹㅋㅋㅋㅋ

@bk3634 6 ай бұрын

카는 양산형 쓰레기 유튜버랑 다르게 바로 본론으로 넘어가는게 너무 좋음

@cjlee6128 6 ай бұрын

조사를 찾기위해 조사하다가, 조사량이 너무 많아 내머리가 조사지겠다. . .

@천재일까 6 ай бұрын

딩애님 영상 잘 봤습니다.

@눈없는선인장 6 ай бұрын

저그충 긁혔네

@cut_te1759 5 ай бұрын

코플님 영상 잘 봤습니다.

@just_appeared7420 13 күн бұрын

딩요애미ㄷㄷ

@책쪼아먹는학헌 6 ай бұрын

조사는 보통 영어로 particle이라 하고 초성 중성 종성은 보통 initial medial final로 쓰지 않나요...?

@ub-ewhdsu32 6 ай бұрын

뭐로 부르든 간 영어가 익숙 하지 않으니 코드 보는 사람 입장에서 편하라고 그냥 코드 변수를 chosung 이런식으로 바꿨다가 핵심 아닐까용

@성이름-q7j5h 6 ай бұрын

예를 들어서 getFinal이란걸 만들었다고 하면, 이게 종성을 갖고오는건지 어떤 물건의 마지막 버전을 갖고오는건지 뭘 갖고오는건지 모르잔슴

@mbc-official 6 ай бұрын

한글 라이브러리들 보통 josa, chosung 등등과 같이 씀

@jinsuko7931 6 ай бұрын

한글표현을 굳이 영어용 표현으로 써서 다시 한국어로 해석해와 사용해야할 필요가.. 😅

@SunnyKimDev 6 ай бұрын

맞습니다. 보통 외국인을 대상으로 한글을 가르칠 때 조사는 particle이라고 많이 합니다. 다만 (자모분해 시)"자모"는 해당하는 단어가 없어 jamo라고 많이 하고요. 자모는 consonant(자음) vowel(모음)이 아니냐 하시는 분들도 있을텐데 "아잉"을 자모분해하면 ㅇㅏㅇㅣㅇ이지만 1번 2번 ㅇ은 consonant이 아닙니다. 음가가 없거든요. 아잉의 first consonant는 놀랍게도 마지막 받침 ㅇ입니다.

@smh.7644 6 ай бұрын

검색엔진 솔루션 업체 다니는데 .. 검색결과에 "말모이" 가 맨앞에 와야한다고 하는데 .. 매년 나오는 신조어 ㅂㄷㅂㄷ

@zeekrx 6 ай бұрын

중국어 병음(pinyin)으로 검색 가능하게 해주는 라이브러리가 있어요. 유덕화면 liu de hua 이런식으로도 가능하고 l d h 이런식으로도 가능하죠.

@dingsu 6 ай бұрын

ㅋㅋ 진짜 재밌게 만드시네요

@JooYeoLeum 6 ай бұрын

어린 백성도 10시간 만에 글을 깨우치게 만드셨으나, 성리학도 안 통하는 기계를 벌하기 위한 세종대왕님의 명안 ㄷㄷ

@박창우-p8d 6 ай бұрын

5:16 initial로 번역하면 되지 않을 까 하는 개인적안 생각입니다

@HY-xu8mf 6 ай бұрын

분해할때 초성 과 종성도 짜증나구요 '긱' 의 초성 'ㄱ' 과 종성 'ㄱ' 은 다른 코드라서 그냥 대충 썻다간 'ㄱㅣㄱ' 이 되어버리구요 중성도 빠질수 없죠. '의' 단어를 분해하면 'ㅇㅢ' 가 남는데, 이걸 그대로 쓰실분은 상관이 없지만, 'ㅇㅡㅣ' 로 사용해야 한다면 예외처리를 해주셔야 하구요. ㅢ 뿐만이 아니라 ㅘ ㅙ ㅚ ㅝ ㅞ ㅟ 도 같이 해주셔야 하구요.

@yong-junjang6681 5 ай бұрын

영어 문법을 쉽게(굴절어 ->고립어) 만들어준 고대 바이킹들한테 감사하도록 합시다. 발음과 철자가 따로 논다는 문제가 있지만...

@andrewnathan629 2 ай бұрын

외국인이 배우기 가장 어려운 언어가 한국어. 이유가 말이 쓸데없이 다양해서 막상 배우고 한국 오면 늘 한국어 어렵다는 사람 많음. 한국어 7년이나 배운 외국인도 아직까지 한국어 맞춤법이나 문법 어렵다고 이야기할정도. 근데 우리도 늘 맞춤법이나 문법 어려워하는거 보면 수십년해도 제대로 못 익히는게 한국어가 아닌가 싶다. 참고로 한국어 다음으로 일본어가 어렵다는데 생각보다 외국인들 일본어 잘 배우더라. 한국어보다는 발음구조가 단순하고 문장구조도 한국어에 비해 그렇게 다양하지 않고 딱딱 형식대로 맞춰떨어지는게 있다보니 쉽다고함. 반대로 한국어는 형식이 없을정도로 다양해서 사실상 고립어에 가까움. 특히 유행에 따라 새로운 문장들이 창조되는데 사실상 외국인 입장에선 암호수준

@aq2814 6 ай бұрын

예전에 문자열내에서 한글만 찾아낼 때 [ㄱ-힇] 으로 처리했던 생각 나네요 ㅎㅎㅎ

@미안하다이거보여-q4d 5 ай бұрын

ㄱ-ㅣ랑 가-힣 사이에 한글 아닌 것도 잇지 않아요??

@돌고돌고 4 ай бұрын

아이폰에서 한글 검색이 빈약하다는 이유가 여기서 나오는군요... 갤럭시가 잘되는 이유는 결국 엄청난 고생의 대가네요

@TheSuccessfulLife1115 6 ай бұрын

포우에 챔피언검색인가 장인랭킹 검색할때는 초성도 되던데 어케한거에요? 심지어 애니 검색할때 ds 쳐도 나옴 ㅇㄴ 라서

@김상우입새 6 ай бұрын

게시글 댓글 크롤링해서 보면 가관입니다. 죽어라 노력해서 크롤링 글들 분석안하려고 대기업감

@nomizomichani 6 ай бұрын

프로그래밍 할 때 유니코드로 하면 함수 명도 한글로 할 수 있는데, 그냥 '초성'이렇게 써도 프로그래밍 가능 한 걸로 알고 있습니다. 굳이 초성 중성 종성을 영어로 쓰고 싶으면 정확히 같은 의미는 아니지만 Onset, Nucleus, Coda (음절초, 음절핵, 음절말) 을 쓰는 편이 좋을 것 같네요. 영어 단어 중 음절이 몇 개인지 그 음절을 Onset, Nucleus, Coda로 구분하는 건 참 어려운데, 한글은 참 쉬워요.

@ssl1746 5 ай бұрын

0:21 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어

@박인준-d9b 6 ай бұрын

울라리, 고글링, 울리 다 처음 듣는데 이게 뭐야 근데 고글링은 좀 어울리는데

@Nicks2809 6 ай бұрын

울트라가 70몇퍼였는데 짤렸음 ㅋㅋㅋ

@slowkim2548 6 ай бұрын

옛날에 쓰던 조합형이 훨씬 데이터 처리면에서 합리적일 것 같은데, 왜 완성형이 표준으로 채택되었나요?

@류현석-n5b 6 ай бұрын

한글 폰트 마다 조합해서 합쳐진거랑 합쳐서 만드는 글자가 디자인이 달라서요

@석혜원-y7h 4 ай бұрын

참고로 옛한글은 조합으로 쓴다고 합니다. 그래서 옛한글이 지원 안되는 폰트는 다 분리가 됩니다.

@sanghyun_jeong 6 ай бұрын

3:31 오마에와 모 신데이루 "나-닣?"

@shuri125 6 ай бұрын

초성검색에서 한글이 유저입장에서는 디지털에 최적화된 게 확실히 맞네요. 개발자들 고생이야 알바 아니고(도망치자)

@엑조디아 5 ай бұрын

자바스크립트에선 .normalize('NFD')를 쓰죠

@narimi12 6 ай бұрын

컴퓨터가 똑똑한게 아니라 코딩해놓은 인간이 똑똑한거였구나?

@luxiantsoltia4870 22 күн бұрын

근데 자연어 처리 해보니까 한국어는 진짜 아무것도 아님. 진짜 끝판왕은 태국어였다...

@p293-b1d Ай бұрын

왠지 항상 폰트 관련 버그날때마다 꽯홃이지랄 나더라

@titleun1052 6 ай бұрын

옛날에 한글 조합기 직접 만들었는데 조합 규칙? 식? 같은게 있어서 생각보다 할만함

@Ev1004 6 ай бұрын

0:24 악의적 편집에 속지 마십시요 여러분... 울트라가 76% 입니다.... 울라리 아니야~~~~~~~~~~~~~~~ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

@mbc-official 5 ай бұрын

공식 줄임말이 울라리/울스크 입니다

@ikhyeonkim4372 6 ай бұрын

토쓰 한글 라이브러리 잘 쓰고 있음돠

@master-wuhan 5 ай бұрын

0:26 왜 대놓고 주작을 하십니까

@sa-lam 6 ай бұрын

0:11 저건 조사가 아니에요 용언의 어미이지 절대 조사 아닙니다 아니 자세히 보니 어미도 아니네. 달리다를 형태소 단위로 분해하면 달리- + -다 가 됩니다. 달리- 까지가 어긴이고 나머지 부분이 어미인데 어미에 모음 ㅣ 까지 포함하고 있네요 아이고 뒷목잡는다 문과살려~~~~~~~