• 제목/요약/키워드: 표준어

검색결과 78건 처리시간 0.02초

식민시기 버마어 산문의 대중화와 버마 민족 형성의 상관성 (The Relation between the Use of Modern Burmese Prose as the Standard Language and Nation-Building in British Burma)

  • 묘우
    • 동남아시아연구
    • /
    • 제22권2호
    • /
    • pp.239-267
    • /
    • 2012
  • 이 논문은 근대 민족국가 형성과 민족 공용어의 창출의 상관성을 염두에 두고 식민지기 버마에서 버마어가 어떠한 정치적, 사회적 환경 하에서 어떻게 공용어의 지위를 획득해나갔는지에 대해 주로 버마어 산문의 대중화라는 각도에서 분석한 것이다. 베네딕트 앤더슨의 연구가 시사하는 것처럼 근대적 인쇄매체의 출현과 더불어 근대 버마어의 등장 및 대중화는 버마의 근대적 민족 형성에 큰 영향을 미쳤다. 제1차 영국-버마 전쟁 종결 후, 정치, 사회, 경제적 상황 변화와 함께 인쇄산업의 발달과 더불어 버마어는 대중매체에서 공용어로서의 지위를 획득해갔다. 식민시기에 버마 내 여러 지역에 어학원이 설립되었고 버마인이 어학교육 담당자로 고용되었다. 1930년대 초반에 근대 버마어 산문이 많은 저자들에 의해 집필되었으며, 1930년대 후반에 들어서서 독자들 사이에서 널리 읽히는 호황을 누렸다. 일본군 점령 후에는 일본군 당국의 허가 하에 버마어는 제2차 세계대전 중에 공식적 언어로서 인정되었다. 이러한 바탕 위에 근대 버마어는 1947년 헌법에 버마의 공식 언어로 명기되었다. 이러한 과정에 대한 분석을 통해 이 논문에서는 버마어가 식민지기에 표준어로서의 지위를 획득하고 그 버마어로 작성된 근대 버마어 산문의 사용이 버마의 민족 형성과정에서 결정적인 역할을 하였다는 점을 부각시켰다.

마약 범죄 추적을 위한 다크웹 상의 소셜미디어 유인 링크 수집체계 개발 (Development of a Collection System of Bait Links to Social Media on Dark Web to Track Drug Crimes)

  • 박솔규;김지연;김창훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.123-125
    • /
    • 2024
  • 다크웹(Dark Web)은 마약, 불법 촬영물, 해킹, 무기 등 불법 콘텐츠의 공유 및 거래가 이루어지는 인터넷 영역으로서 최근에는 소셜미디어와 연계된 형태로 범죄 양상이 변화하고 있다. 본 논문에서는 최근 국내 외 사회 문제로 대두되고 있는 마약 범죄를 추적하기 위한 다크웹 수사 기술로서 다크웹 사용자를 소셜미디어로 유인하는 마약 정보 수집체계를 개발한다. 먼저 미국 마약단속국에서 공개한 대표적인 마약 용어 3개의 표준어 및 은어를 검색 키워드로 사용하여 마약 관련 다크웹을 수집하고, 수집된 다크웹을 크롤링하여 소셜미디어 계정 링크를 추출한다. 본 논문에서는 다양한 소셜미디어 중, 트위터 및 텔레그램 접속 링크를 수집하였으며 실험 결과, 접속 가능한 총 54개 다크웹 도메인의 9,046개 웹 페이지에서 트위터 유인 링크 567개, 텔레그램 유인 링크 118개를 추출하였다.

  • PDF

SMS 변형된 문자열의 자동 오류 교정 시스템 (Automatic Error Correction System for Erroneous SMS Strings)

  • 강승식;장두성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권6호
    • /
    • pp.386-391
    • /
    • 2008
  • 휴대폰과 메신저 등 통신 환경에서 문자 메시지를 전송할 때 표준어가 아닌 왜곡된 어휘들을 사용하고 있으며, 이러한 변형된 어휘들은 음성 인식, 음성 합성, 문서 정보 추출 등 언어처리 및 관련 분야의 응용 시스템에서 많은 문제점을 유발시킨다. 본 논문에서는SMS 문장들의 변형 및 띄어쓰기 오류를 자동으로 교정하여 형태소 분석 및 품사 태깅의 성능 저하 문제를 방지하는 문자열 오류의 교정 방법을 제안하고 시스템을 구현하였다. 시스템의 성능에 가장 큰 영향을 미치는 변형된 문자열 사전을 구축하는 방법으로 (1) 통신 어휘집을 기반으로 수동으로 구축하는 방법, (2) 수작업으로 구축된 말뭉치로부터 자동으로 변형된 문자열을 추출하는 방법, (3) 자동으로 변형된 문자열을 추출할 때 좌우 문맥을 고려하는 방법에 대하여 시스템을 구현하고 실험을 통하여 비교-분석 및 성능 평가 결과를 제시하였다.

구글사의 위성영상과 미국의 지명데이터베이스에 나타나는 지명 비교연구-한국과 대만사례를 중심으로 (A Study of Gazette Comparison of Google Earth and US Data base -in case of Korea and Taiwan-)

  • 박경;장은미
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2007년도 GIS 공동춘계학술대회 논문집
    • /
    • pp.203-211
    • /
    • 2007
  • 세계화의 빠른 진행과 더불어 외국에 대한 정확한 인식은 매우 중요한 문제로 등장하였다. 아직도 사실적 오류와 더불어 국제관계에서의 위치 때문에 많은 오류가 남아 있는 점도 사실이다. 그 가운데 미국의 위성영상서비스 가운데 가장 대표적인 구글사의 검색서비스와 미국지리정보국의 지명데이터베이스에 관한 내용을 분석함으로서 문제의 뿌리가 어디인지를 밝히고자 하였다. 이미 구글에 관련된 논문은 Science Direct 검색결과 69개가 검색되고 있을 만큼 전세계적 문화적 영향력을 가지고 있다. 본고에서는 전 세계의 지명을 영어로 서비스하고 있는 구글사와 미국의 지명 DB내에 있는 오류사례를 찾아내고, 그 유형을 분석하고, 특히 일제의 강점을 당했던 한국과 대만사례를 비교하는 데 있다. 대만 역시 1945년 제2차 세계대전의 종전으로 인해 일본의 영향에서 벗어나게 되었다. 따라서 지명에도 일본의 영향이 크게 남아 있을 것으로 보고 앞서 나온 유형대로 몇 개의 분석을 실시하였다. 그 중 대표적인 것을 들면, 경상남도 남해군 일원의 위성영상을 보면 최소한 3개의 일본식 지명이 나타난다. 우선 해양지명으로 미조만은 Mijo-wan으로 앵강만은 Oko-wan으로 표시되어 있고, 천황산은 Tenno San이라는 지명으로 나타나고 있다. 제주도의 한라산을 지칭하는 표준어는 Halla-san으로 등재되어 있으나 이명으로 소개되어 있는 것이 무려 11개나 등록되어 있는 것으로 파악되었다. Halla-san에 대한 미국의 NGA(National Geospatial-Intelligence Agency)의 지명정보 데이터베이스에서 검색한 결과는 아래와 같다. 앞의 간라산 또는 간다산 등은 일본식 표기임이 확실하며 여기에 오크랜드산(Auckland, Mount)이라고 또한 표기되어 있음을 확인할 수 있다. 대만의 경우 총 1,280개의 산악명과 산맥명이 등재되어 있으니 일본어 표기는 하나도 없으며, 영어로 Central Mountains와 Seaboard Mountains두개만 영문표기 지명이 등재되어 있을 뿐이며, 그 가운데 12개는 한자로 표기되어 있다. 국내의 지명이 모두 영문 알파벳으로 표기된 것과는 달리 대만의 경우 한자지명이 그대로 데이터베이스에 등재되어 있다. 하천의 경우를 분석해보면 1485개의 지명이 등록되어 있으며 이 가운데 24개는 한자지명으로 표기되어 있다. 유형별 분석을 통한 연구결과가 올바른 지명 찾기에 기여하고, 독도와 백두산에 국한된 지명논쟁의 근간을 공고히 하는데 기여할 것으로 사료된다.

  • PDF

한국 남성의 단모음 [아, 에, 이, 오, 우]에 대한 음향음성학적 기반연구 (Fundamental Acoustic Investigation of Korean Male 5 Monophthongs)

  • 최예린
    • 한국콘텐츠학회논문지
    • /
    • 제10권6호
    • /
    • pp.373-377
    • /
    • 2010
  • 영어의 경우는 모음포만트 분석이 질적이나 양적으로 이미 오래전부터 많이 이루어져 왔다. 그러나 한국어 모음이 음향음성학적으로는 제대로 분석되지 않고 있는 실정이다. 본 연구의 목적은 한국어 모음에 대한 음향음성학적 측면에서 정량적으로 충분한 자료 확보를 위한 과정의 일환으로 정상 남자 20대와 30대를 대상으로 한국어 모음의 음향학적 측면에서 정량적 자료를 얻고자 하였다. 한국어 표준어를 산출하는 20~30대의 남자 총 31명을 대상으로 기본 5 모음 인 /아, 에(애), 이, 오, 우/를 3회 반복산출한 것을 Cool edit에 녹음하여 MATLAB음향분석 프로그램을 이용하여 모음의 F1, F2, F3, F4를 구하였다. F1과 F2 모두에서 본 연구의 모음 포만트가 선행연구보다 전반적으로 낮은 경향을 보였으나 전체적인 패턴은 매우 유사하였다. 연령별, 어음재료에 따른 한국어 모음 자료들에 대한 연구가 더 요구될 것으로 사료된다.

심장 상태와 발음간의 연관성 분석을 위한 성대 진동의 변화율 추출 (Change Rate Extraction of Vocal Fold Vibration for Heart Conditional and Pronunciation of Correlative Analysis)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제35권2B호
    • /
    • pp.191-196
    • /
    • 2010
  • 흡연, 당뇨, 비만 및 스트레스 등에 의한 심장 질환이 증가됨에 따라 이로 인한 사망률이 늘어나면서 심장 질환은 현대 사회에서 조기 진단의 필요성을 제시하고 있는 실정이다. 특히 심장 질환에 대한 사람들의 무지와 무관심 때문에 발병율이 급격히 증가하고 있다. 따라서 이와 같은 심장 질환에 대한 사회적 현상을 해결하기 위해 본 논문에서는 동의보감에서 제시하고 있는 심장 상태에 대한 진단 이론을 기반으로 심장 질환의 조기 진단에 필요한 객관적 출력 변수를 설계하였다. 특히 심장 질환에 따른 발음의 부정확성을 입증하기 위해 성대의 진동 변화율을 추출하여 실험 집단간의 비교, 분석을 수행하였다. 이를 위해 본 논문에서는 표준어를 구사하는 성인 남성 중에서 심장 질환을 앓고 있는 환자들과 심장에 이상이 없는 정상인들로 피실험자 집단을 구성하고 이들의 음성을 수집하여 성대 진동의 변화율에 대한 비교, 분석을 통해 심장 질환에 대한 조기 진단 방법을 제안하였다.

한국어 음성 합성을 위한 음가 변환 테이블 생성 (Formation of A Phonetic-Value Look-up Table for Korean Voice Synthesis)

  • 이계영;임재걸
    • 전자공학회논문지CI
    • /
    • 제38권5호
    • /
    • pp.44-57
    • /
    • 2001
  • 문법적으로 정확한 한국어 음성을 합성하려면 표준어 규정의 '표준 발음법'을 준용해야 한다. 따라서 한국어 음가 합성 시스템에 사용되는 한글을 음성으로 변환하여 주는 규칙은 '표준 발음법'을 완전하게 반영하며 또한 무결해야 한다. 기존의 연구에서는 표준 발음법을 검증없이 적용하여 왔고, 표준 발음법 자체에 모순이 있는가의 여부에 대해서도 체계적인 분석을 위한 시도가 진부하였다. 본 논문에서는 한국어 음가 생성의 기본 규칙으로 준용할 표준 발음법을 페트리 넷으로 모델링하여 표준 발음법의 일관성을 검증하였다. 그리고, 음운 변동 현상을 여러 단계로 나누어 차례로 적용한다든지, 변동된 단어에 대하여 처음부터 다시 변환 작업을 재수행하는 기존의 음가 생성 방법의 문제점을 해결하기 위하여 한번의 테이블 탐색으로 모든 음운 변동이 완료되는 한국어 음성 합성을 위한 음가 변환 테이블을 구현하였다.

  • PDF

화자 연령 지각과 음성적 특성: 음높이와 발화 속도를 중심으로 (Speaker age estimation and acoustic characteristics: According to pitch and speech rate)

  • 서윤정;신지영
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.9-18
    • /
    • 2019
  • 본고는 한국인 피험자를 대상으로 지각 실험을 진행하여 화자의 실제 연령(Chronological age)과 지각 연령(Perceived age) 간의 상관관계를 살피고, 한국인 피험자가 얼마나 정확하게 익명의 화자의 연령을 지각할 수 있는지를 밝히고자 한다. 또한, 이러한 연령 지각에 음성적 단서가 되는 음높이와 발화 속도와 지각 연령 간의 영향 관계를 검토하고자 한다. 이를 위해, 성인 80명을 대상으로 3가지 과제로 구성된 지각 실험을 진행하였다. 실험 자극은 표준어 화자 40명에게서 추출되었으며, 자유 발화, 낭독 발화, 모음 연장 발성으로 구성되었다. 각 실험은 10초 내외의 음성을 듣고 연령을 구체적인 숫자로 답하는 방식으로 진행되었다. 분석 결과, 한국인 피험자들은 상당히 높은 판단 정확도를 보였으며, 모음 연장 발성을 들었을 때보다 자유 발화와 낭독 발화를 들었을 때 화자의 연령을 더욱 정확하게 짐작하였다. 이러한 결과는 음성이 포함하고 있는 정보량의 차이에 기인한 것으로 보인다. 또한, 음성 분석을 수행한 결과 피험자들은 화자의 음높이와 발화 속도를 참고하여 화자의 연령을 추정하는 것으로 나타났으며, 음높이보다는 발화 속도가 연령 지각에 더 적극적으로 기여한 것으로 나타났다.

내용분석 및 자유연상을 통한 미디어 파사드의 감성어휘 추출 (A Study on the Extraction of Emotional Words for Media Facade)

  • 이승민;방기천
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권5호
    • /
    • pp.741-748
    • /
    • 2015
  • 본 연구의 목적은 미디어 파사드(Media Facade)의 사용자 감성을 이해하기 위한 감성어휘를 연구하여, 정량적이고 객관적인 미디어 파사드 감성 평가척도의 기초를 마련하고자 하였다. 연구 방법은 먼저, 내용분석을 위해 다양한 분야에서 수집된 기존의 감성어휘들을 조사하여 통합하였고, 유튜브 사이트의 미디어 파사드에 남긴 사용자들의 댓글을 통해 감성어휘를 수집하였다. 또한 자유연상방법을 활용한 비구조적 설문조사를 위해, 실험실에서 사용자들에게 미디어 파사드 영상을 보여주고 자신의 느낌을 글로 표현하도록 하였다. 이렇게 수집된 어휘들은 일관성을 위해 표준어 형용사의 형태로 통일 하고, 유사 어휘 및 유사 개념의 어휘는 하나로 통합하여 설문에 사용할 수 있는 39개의 어휘로 정리하였다. 최종적으로 미디어 파사드에 의한 사용자들의 감성어휘는 '기발하다', '멋있다', '대단하다', '화려하다', '흥미롭다', '놀랍다', '신기하다', '현란하다', '굉장하다', '강렬하다', '좋다', '웅장하다', '다채롭다', '독특하다', '다양하다', '새롭다', '재미있다', '아름답다', '고급스럽다', '신비롭다', '만족스럽다' 등 총 21개로 추출되었다. 미디어 파사드의 제작에 있어 이러한 감성어휘를 다양한 효과로 활용하면 사용자의 감성을 충족시킬 수 있는 디자인 방향을 설정하는데 효과적일 뿐 아니라, 감성평가의 기본 자료로 활용될 수 있을 것으로 사료된다.

한글 단어의 음성 인식 처리에 관한 연구 (A Study on Processing of Speech Recognition Korean Words)

  • 남기훈
    • 문화기술의 융합
    • /
    • 제5권4호
    • /
    • pp.407-412
    • /
    • 2019
  • 본 논문에서는 한글 단어 단위의 음성 인식 처리 기술을 제안한다. 음성 인식은 마이크와 같은 센서를 사용하여 얻은 음향학적 신호를 단어나 문장으로 변환시키는 기술이다. 대부분의 외국어들은 음성 인식에 있어서 어려움이 적은 편이다. 그에 반면, 한글의 모음과 받침 자음 구성이어서 음성 합성 시스템으로부터 얻은 문자를 그대로 사용하기에는 부적절하다. 기존 구조의 음성 인식 기술을 개선해야만 보다 정확하게 단어를 인식할 수 있다. 이러한 문제를 해결하기 위해 기존 방식의 음성 인식구조에 새로운 알고리즘을 추가하여 음성 인식률을 높이게 하였다. 먼저 입력된 단어를 전처리 과정을 수행한 후 결과를 토큰 처리한다. 레벤스테인 거리 알고리즘과 해싱 알고리즘에서 처리된 결과 값을 조합한 후 자음 비교 알고리즘을 거쳐 표준 단어를 출력한다. 최종 결과 단어를 표준화 테이블과 비교하여 존재하면 출력하고 존재하지 않으면 테이블에 등록하도록 하였다. 실험 환경은 스마트폰 응용 프로그램을 개발하여 사용하였다. 본 논문에서 제안된 구조는 기존 방식에 비해 인식률의 성능이 표준어는 2%, 방언은 7% 정도 향상되었음을 보였다.