:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
23/05/19 18:31
구글 bard
1차 한글은 24개의 자음과 모음으로 구성되어 있으며, 이 자음과 모음을 조합하여 수많은 단어를 만들 수 있습니다. 그러나 흔히 많이 쓰이는 단어는 그리 많지 않습니다. 국립국어원에서 발행한 ‘2020년 세종말뭉치’에 따르면, 한국어에서 가장 많이 쓰이는 단어는 ‘이다’로 1,407,538건이 사용되었습니다. 그 뒤를 이어 ‘이, 그, 은, 는, 것, 있다, 안, 의, 할, 말, 때, 와, 을, 의, 로, 나, 에서, 으로, 는가, 는지, 을까, 을까요, 을까요?, 을까요?’가 사용되었습니다. 위에서 언급한 단어들은 모두 10만건 이상 사용된 단어들입니다. 10만건 미만으로 사용된 단어들도 많지만 그 수는 매우 많습니다. 따라서 흔히 많이 쓰이는 한글 단어의 수는 그리 많지 않다고 할 수 있습니다. 2차 흔히 많이 쓰이는 한글 단어의 수는 약 20,000개로 추정됩니다. 국립국어원에서 발행한 ‘2020년 세종말뭉치’에 따르면, 한국어에서 10만건 이상 사용된 단어는 약 5,000개, 1만건 이상 사용된 단어는 약 15,000개입니다. 따라서 흔히 많이 쓰이는 한글 단어의 수는 약 20,000개로 추정할 수 있습니다. 한글은 24개의 자음과 모음으로 구성되어 있으며, 이 자음과 모음을 조합하여 수많은 단어를 만들 수 있습니다. 그러나 흔히 많이 쓰이는 단어는 그리 많지 않습니다. 왜냐하면, 한글의 자음과 모음은 조합에 제약이 있기 때문입니다. 예를 들어, 자음 ‘그’은 모음 ‘아’와는 결합할 수 있지만 모음 ‘오’와는 결합할 수 없습니다. 또한, 자음 ‘느’은 모음 ‘어’와는 결합할 수 있지만 모음 ‘이’와는 결합할 수 없습니다. 이러한 제약 때문에, 한글에서 만들 수 있는 단어의 수는 실제로는 매우 적습니다. 흔히 많이 쓰이는 단어의 수는 그 중에서도 더 적습니다. chat gpt 무료 한글은 조합이 가능한 글자의 수가 많기 때문에 흔히 쓰이는 단어의 수를 정확히 파악하는 것은 어렵습니다. 그러나 일반적으로 사용되는 단어들의 수는 약 10만 개 이상이라고 추정됩니다. 한글의 음절은 초성, 중성, 종성의 결합으로 이루어져 있으며, 각각의 자음과 모음은 조합하여 음절을 형성합니다. 한글의 초성은 14개, 중성은 10개, 종성은 14개로 이루어져 있습니다. 따라서 한글 음절의 총 가지수는 14 * 10 * 14 = 1,960입니다. 한글 단어는 음절의 조합으로 이루어지며, 조합의 범위는 매우 넓습니다. 흔히 쓰이는 단어는 수천 개에서 수만 개까지 다양하며, 이는 명확한 통계 데이터가 없어 추정하기 어렵습니다. 한글 단어의 수는 계속해서 변하고 새로운 단어가 생겨나기 때문에 정확한 수를 파악하는 것은 어렵습니다. 다만, 한국어 사전에 수록된 단어의 수를 기준으로 살펴보면, 일반적으로 사용되는 단어의 수는 약 30만 개에서 40만 개 정도로 추정됩니다. 이는 일상 대화나 글쓰기에서 흔히 사용되는 단어의 수를 포함한 것으로, 과학 용어, 전문 용어, 사회적으로 제한된 분야의 어휘 등은 이에 포함되지 않을 수 있습니다. 따라서 한글의 흔히 사용되는 단어의 수는 약 10만 개 이상이라고 할 수 있지만, 이는 정확한 수치가 아니며 참고로만 받아들이시기 바랍니다.
23/05/19 21:08
한글의 초성은 14개, 중성은 10개, 종성은 14개로 이루어져 있습니다. 따라서 한글 음절의 총 가지수는 14 * 10 * 14 = 1,960입니다.
<- 이건 정보 오류인 것 같네요...쌍자음이 있고 조합모음이 있는데 다 빼버렸네요. 아이고...
23/05/19 19:52
음절을 물어보신건가보네요.. 저도 음절 빈도는 잘 모르겠고
단모음키보드를 쓰다가 알게된건데 음소(음운?) 빈도는 https://story.pxd.co.kr/958 요기한번참고해보세요. 아마도 '아'가 제일 많이 쓰이는 음절인 듯 합니다
23/05/19 21:10
궁금하신 부분과 매우 관련이 높은 논문이 있네요.
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002577322 이은하, 남기춘, 세종 말뭉치에 나타난 한국어 음절의 빈도와 분포, 언어과학연구 92집 (2020년 3월) 79-130 3.2.1에서 세종 말뭉치에 사용된 전체 음절의 가짓수는 2110개며, 상위 20개가 그 중 33.35%, 상위 100개가 67.28%를 차지했다고 합니다. 100회 이상 나타난 음절은 617가지로 이들이 전체의 97.71%를 차지했습니다. 반대로 10회 이하로 사용된 음절은 326개며, 그 중 100개는 단 한 차례만 사용되었습니다. 가장 많이 사용된 음절은 '이'며, 그 다음으로는 '다', '는', '의', '에'가 뒤를 이었습니다. 이 논문에서는 일반명사와 용언(동사, 형용사)로 또 나누어서 같은 분석을 했는데요. 일반명사에서는 '이', '사', '기', '자', '적' 순으로 많이 사용되었고, 용언에서는 '다', '하', '되', '시', '리' 순으로 많이 사용되었습니다. 더 나아가서 첫째 음절과 둘째 음절의 빈도를 또 분석했는데, 전체에서는 첫째 음절에 '그', '이', '있', '것', '사', 둘째 음절에는 '이', '는', '다', '리', '어' 순으로 많이 사용되었습니다. 이것도 일반명사와 용언으로 나누어 보면, 일반명사에서는 첫째 음절에 '대', '사', '수', '비', '전', 둘째 음절에 '사', '리', '수', '기', '이' 순으로 많이 사용되었습니다. 용언에서는 첫째 음절에 '재', '부', '가', '수', '무', 둘째 음절에 '다', '하', '리', '지', '어' 순으로 많이 사용되었습니다. 논문이 길긴 한데 자세하게 분석이 되어 있어서 직접 읽어보셔도 재미있을 것 같습니다.
|