• Title/Summary/Keyword: 어휘추출

Search Result 438, Processing Time 0.026 seconds

정보 중립성 확보를 위한 인터넷 뉴스 댓글의 정치성향 분석 (Political Information Filtering on Online News Comment)

  • 최혜봉;김재홍;이지현;이민구
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.575-582
    • /
    • 2020
  • 본 연구는 인터넷 뉴스 댓글 빅데이터 분석을 통해 뉴스 댓글 사용자의 정치적 성향을 추정하는 방법을 제안한다. 인터넷 뉴스 댓글과 작성자의 정치 성향을 함께 제공하여 디지털 매체를 통한 정보 전달의 객관성과 중립성을 확보하고자 한다. 250만 건 이상의 인터넷 뉴스 댓글의 특성을 분석하고 사용자의 정치적 성향을 효과적으로 추정하기 위한 특징을 추출한다. 어휘사전 기반 알고리즘과 유사도 기반 알고리즘을 제안하고 실험을 통해 두 알고리즘을 비교하고 효과를 검증한다.

문장단위 운율발생용 인공신경망에 관한 연구 (A Study on the Artificial Neural Networks for the Sentence-level Prosody Generation)

  • 신동엽;민경중;강찬구;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.53-56
    • /
    • 2000
  • 무제한 어휘 음성합성 시스템의 문-음성 합성기는 합성음의 자연감을 높이기 위해 여러 가지 방법을 사용하게되는데 그중 하나가 자연음에 내재하는 운을 법칙을 정확히 구현하는 것이다. 합성에 필요한 운율법칙은 언어학적 정보를 이용해 구현하거나, 자연음을 분석해 구한 운을 정보로부터 운율 법칙을 추출하여 합성에 이용하고 있다. 이와 같이 구한 운을 법칙이 자연음에 존재하는 운율 법칙을 전부 반영하지 못했거나, 잘못 구현되는 경우에는 합성음의 자연성이 떨어지게 된다. 이런 점을 고려하여 우리는 자연음의 운율 정보를 이용해 인공 신경망을 훈련시켜, 문장단위 운율을 발생시킬 수 있는 방식을 제안하였다. 운율의 세 가지 요소는 피치, 지속시간, 크기 변화가 있는데, 인공 신경망은 문장이 입력되면, 각 해당 음소의 지속시간에 따른 피치 변화와 크기 변화를 학습할 수 있도록 설계하였다. 신경망을 훈련시키기 위해 고립 단어 군과 음소균형 문장 군을 화자로 하여금 발성하게 하여, 녹음하고, 분석하여 구한 운을 정보를 데이터베이스로 구축하였다. 문장 내의 각 음소에 대해 지속시간과 피치 변화 그리고 크기 변화를 구하고, 곡선적응 방법을 이용하여 각 변화 곡선에 대한 다항식 계수와 초기치를 구해 운을 데이터베이스를 구축한다. 이 운을 데이터베이스의 일부를 인공 신경망을 훈련시키는데 이용하고, 나머지를 이용해 인공 신경망의 성능을 평가한 결과 운을 데이터베이스를 계속 확장하면 좀더 자연스러운 운율을 발생시킬 수 있음을 관찰하였다.

  • PDF

웹을 이용한 개체명 부착 말뭉치의 자동생성과 정제 (Automatic Generation of Named Entity Tagged Corpus using Web Search Engine)

  • 안주희;이승우;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-91
    • /
    • 2002
  • 최근 정보 추출, 질의응답 시스템 등의 고정밀 자연어처리 어플리케이션이 부각됨에 따라 개체명 인식의 중요성이 더욱 커지고 있다. 이러한 개체명 인식을 위한 학습에는 대용량의 어휘자료를 필요로 하기 때문에 충분한 학습 데이터, 즉 개체명 태그가 부착된 충분한 코퍼스가 제공되지 못하는 경우 자료희귀문제(data sparseness problem)로 인하여 목적한 효과를 내지 못하는 경우가 않다. 그러나 태그가 부착된 코퍼스를 생성하는 일은 시간과 인력이 많이 드는 힘든 작업이다. 최근 인터넷의 발전으로 웹 데이터는 그 양이 매우 많으며, 습득 또한 웹 검색 엔진을 사용해서 자동으로 모음으로써 다량의 말뭉치를 모으는 것이 매우 용이하다. 따라서 최근에는 웹을 무한한 언어자원으로 보고 웹에서 필요한 언어자원을 자동으로 뽑는 연구가 활발히 진행되고 있다. 본 연구는 이러한 연구의 첫 시도로 웹으로부터 다량의 원시(raw) 코퍼스를 얻어 개체명 태깅 학습을 위한 태그 부착 코퍼스를 자동으로 생성하고 이렇게 생성된 말뭉치를 개체면 태깅 학습에 적용하는 비교 실험을 통해 수집된 말뭉치의 유효성을 검증하고자 한다. 향후에는 자동으로 웹으로부터 개체 명 태깅 규칙과 패턴을 뽑아내어 실제 개체명 태거를 빨리 개발하여 유용하게 사용할 수 있다.

  • PDF

한식정보 활용을 위한 온톨로지 설계에 관한 연구 (The Study on Design an Ontology for Korean Food Information)

  • 유하경;박옥남
    • 한국콘텐츠학회논문지
    • /
    • 제19권2호
    • /
    • pp.147-158
    • /
    • 2019
  • 한국의 고유문화로만 주목을 받아온 한식은 한류 및 1인 미디어의 소재로 활용되며 세계 시장 속에서 인기를 이어가고 있다. 한식의 조리법에 더하여 한식의 가치를 부각시켜줄 수 있는 관련 자료들을 체계적으로 조직하는 것은 확장 및 제한검색, 효과적인 브라우징을 통한 한식 콘텐츠의 재사용성을 향상시키는 데 토대가 된다. 이에 본 연구는 한식 지식구조의 정립을 위한 온톨로지의 설계를 목적으로 한다. 온톨로지 모델링은 OWL을 활용하였으며, 한식 정보를 담고 있는 32권의 단행본을 기반으로 한식의 유형 및 어휘를 조사하고, 음식 정보를 기반으로 하는 5개의 도메인 및 어플리케이션을 분석하여 데이터요소를 추출하였다. 연구결과 클래스 및 관련 속성을 도출하였고, 클래스별 속성과 색인예를 제시하였다.

재난과 관련된 지명에 투영된 방재인식에 관한 연구 (A Study of Disaster Recognition Based on Disaster-related Place Names)

  • 박경;김선희
    • 한국지형학회지
    • /
    • 제17권2호
    • /
    • pp.15-28
    • /
    • 2010
  • 재해 유형별로 관련된 재해 지명어를 도출하여 지도 및 문헌, 지명정보서비스 등 전체 6종의 자료에 나타난 재해 관련 지명을 확인하고 수집하여 데이터베이스를 구축하였다. 이를 토대로 지명을 통해 나타나는 재해 유형별 지명의 지역별 분포 특성을 분석하여 현재 급증하고 있는 재난에 대비한 방재대책 수립 및 방재영향평가에 활용될 수 있는 가능성을 탐색하고자 하였다. 자연재해와 방재 관련 지명을 대상으로 총 128개의 재해 유형별 재해 지명어를 먼저 추출하였고, 이후 이 검색어를 중심으로 해동지도, 1872군현도, 오만분지일지형도, 지명총람, 신구대조 조선전도부군면리동명칭일람, 지명정보서비스 등 총 6종의 자료를 대상으로 재해 지명을 검색하여 DB화하였으며, 각 자료별로 지역별·재해 유형별 특성을 분석하였고, 활용방안을 제시하였다.

의미처리 기반의 한글-한자 변환 시스템 (korean-Hanja Translation System based on Semantic Processing)

  • 김홍순;신준철;옥철영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.398-401
    • /
    • 2011
  • 워드프로세서에서의 한자를 가진 한글 어휘의 한자 변환 작업은 사용자에 의해 음절/단어 단위의 변환으로 많은 시간이 소요되어 효율이 떨어진다. 본 논문에서는 한글 문장의 의미처리를 통해 문맥에 맞는 한자를 자동 변환하는 시스템을 제안한다. 문맥에 맞는 한글-한자 변환을 위해서는 우선 정확한 형태소 분석 및 동형이의어 분별이 선행되어야 한다. 이를 위해 본 논문에서는 은닉마르코프모델 기반의 형태소 및 동형이의어 동시 태깅 시스템을 구현하였다. 제안한 시스템은 형태의미 세종 말뭉치 1,100만여 어절을 이용하여 unigram과 bigram을 추출 하였고, unigram을 이용하여 어절의 생성확률 사전을 구축하고 bigram을 이용하여 전이확률 학습사전을 구축하였다. 그리고 품사 및 동형이의어 태깅 후 명사를 표준국어대사전에 등재된 한자로 변환하는 시스템을 구현하였다. 구현된 시스템의 성능 확인을 위해 전체 세종 말뭉치를 문장단위로 비학습 말뭉치를 구성하여 실험하였고, 실험결과 한자를 가진 동형이의어에 대한 한자 변환에서 90.35%의 정확률을 보였다.

기계학습 및 필터링 방법을 결합한 경쟁관계 인식 (Competition Relation Extraction based on Combining Machine Learning and Filtering)

  • 이충희;서영훈;김현기
    • 정보과학회 논문지
    • /
    • 제42권3호
    • /
    • pp.367-378
    • /
    • 2015
  • 본 논문은 기계학습 방법과 필터링 방법을 결합해서 경쟁관계를 인식하는 방법에 대한 연구이다. 기존 연구들은 기계학습 방법에만 의존해서 관계유형을 인식하는 연구들이 대부분이며. 사용되는 자질도 일반적인 관계유형에 적합한 자질을 사용하고 특히 구문분석 정보가 매우 중요한 자질로 사용된다. 본 논문에서는 구문분석 등의 언어분석 결과를 이용하지 않고, 단순한 자질들(어휘, 거리, 위치, 단서단어)만을 사용해도 경쟁관계 인식에 효과적임을 확인하였다. 또한, 경쟁관계인식 긍정 정확도를 향상시킬 수 있는 문장별 경쟁유무 분류방법, 스팸분류 방법, 거리제약 기반 자질필터링 방법을 기계학습 방법과 결합한 방법론을 제안한다. 방법론 검증을 위해서 뉴스분야 2,565개 문장을 평가셋으로 구축하였고, 비교 평가를 위해서 규칙기반 경쟁관계 인식기와 기존연구의 관계추출 방법론에 기반한 일반 관계추출기를 적용해서 비교하였다. 성능평가 결과로 규칙기반 엔진이 긍정정확도와 전체정확도(accuracy)가 81.2%와 56.8% 성능을 보였고, 일반 관계추출기는 61.2%와 56.3%를 보였다. 그에 비해서 본 논문에서 제안하는 방법은 긍정 정확도 92.2%와 전체정확도 71.3% 성능을 보여서 경쟁관계 인식에 효과적임을 확인하였다.

가족관련변인과 영유아발달의 관계 : 종일제 보육과 어머니 단독양육의 비교 (The Relations between Familial Predictors and Infant-Toddler Development: Comparison between Full-Time Child Care vs. Exclusive Mother Care)

  • 장영은
    • 한국보육지원학회지
    • /
    • 제10권4호
    • /
    • pp.159-176
    • /
    • 2014
  • 본 연구는 영유아기 종일제 어린이집 이용 여부에 따라 가족관련 변인이 영유아발달에 가지는 관계성의 강도가 다를 수 있다는 가설을 검증하는 데에 목적이 있다. 한국아동패널연구의 3차년도 및 4차년도 조사자료를 분석하여 종일제 어린이집을 이용(주당 30시간 이상의 어린이집 이용)집단과 어린이집이나 대리양육자를 이용하지 않는 어머니 단독양육 집단을 추출하여, 일련의 가족관련 변인과 영유아의 발달적 결과 간의 관계성의 양상과 그 강도를 비교하였다. 분석방법으로 이변량 상관관계분석을 실시하였으며 두 집단의 상관계수 간의 유의한 차이를 검증하였다. 연구결과, 만2세의 경우 어머니의 사회적 양육유형이 영아의 의사소통을 정적으로 예측하는데 있어 종일제 어린이집을 사용하는 가족에서 그 크기가 유의하게 큰 것으로 나타났다. 만 3세 때에는 가정환경검사 중 다수의 하위변인에서 어린이집을 이용하지 않는 가족의 경우, 종일제 어린이집을 이용하는 경우에 비해 유의하게 강한 상관관계로 표현어휘 및 수용어휘 발달을 예측하였다. 즉, 어린이집에서 시간을 보내는 경우, 가정환경 외에 다른 요인이 발달을 예측할 수 있음을 시사한다. 하지만 이들 변인 외에 분석에 사용된 다양한 변인과 영유아 발달 간의 상관관계에 집단차는 발견되지 않아 발달에 기여하는 가족과정이 종일제 어린이집과 어머니 단독양육 집단 간에 유사 또는 차별적이라고 단순히 결론 내릴 수 없고, 발달연령, 가족과정 내의 예측요인, 그리고 발달적 결과에 따라 다소 복잡한 유형으로 차이를 보임을 알 수 있다.

In Vitro 소화시 lgy항체 활성의 안정성에 대한 계란 성분의 효과 (Effect of Eff Component on Stability of IgY Antibody Acitivity to In Vitro Digestion)

  • 이승배;최석호
    • 한국축산식품학회지
    • /
    • 제20권4호
    • /
    • pp.303-310
    • /
    • 2000
  • In vitro 소화시 계란 성분이 anti-Y ruckeri IgY 항세 활성을 안정화시키는데 어떡해 관여하는지를 SDS-PAGE와 ELISA로 조사한 결과는 다음과 같다. Anti-Y ruckeris IgY 항체와 난황 및 난백으로 혼합 후 펩신으로소화시킨 후 경우 1시간 후 난황 및 난백이 혼합된 시료에서 모두 anti-Y ruckeri IgY 항체의 heavy chain과 light chain이 분해는 되었지만 어느 정도 밴드를 관찰할 수있었으며, anti-Y, ruckeri IgY 항체 활성 측정한 결과 난황시료는 35%, 난백시료는 61%의 항체 활성을 유지시켰다. Anti-Y ruckeri IgY 항체와 오보알부민, 오보뮤우신, 라이소자임 및 오보뮤코이드를 혼합 한 후 펩신으로 소화시킨 경우 1시간 우에는 anti-Y, ruckeri IgY항체의 heavy chain의 밴드르 fdjsm 정도 볼 수 있는 형태로 나타났으며, anti-Y, ruckeri IgY 항체의 light chain는 오보뮤우신 및 오보뮤코이드가 홉합되어 펩신으로 소화시킨 경우 1시간 후에는 밴드를 거의 볼수 없었으나 오보알부민 오보트란스훼린 및 라이소자임에 혼합된 시료에서 밴드를 관찰할수 있었다. 특히 라이소자임과 오보트란스훼린의 경우 펩신 호화 2시간 우에도 anti-Y, ruckeri IgY 항체의 light 밴드가 관찰되었다. 펩신소화 1시간 후에 난백성분이오보알부민, 오보뮤우신, 라이소자임, 오보트란스웨린 및 오부뮤코이드 중에서 단지 오보트란스훼린만이 38%의 anti-Y, ruckeri IgY 항체 활서을 보인후 2시간 후에도 15% 정동의 활성을 나타내었다. anti-Y, ruckeri IgY항체와 난백 및 전란을 혼합한 다음 무지개송어 위 추출액으로 소화시 2시간 후에 난백은 14%, 전란은 69%로 anti-Y, ruckeri IgY 항체 활성을 유지시킨 것으로 나타났다.X> $e_{I}$ WPi_BE_QE]]]]]로 상징하며 WLWQ에 적용되는 몇 가지 제약을 관찰하고 이를 일반적인 언어원리로 설명한다. 첫째, XP는 주어로만 해석되는데 그 이유는 XP가 목적어 혹은 부가어 등 다른 기능을 할 경우 생략 부위가 생략의 복원 가능선 원리 (the deletion-up-to recoverability principle)를 위배하기 때문이다. 둘째, WLWQ가 내용 의문문으로만 해석되는데 그 이유는 양의 공리(the maxim of quantity: Grice 1975) 때문이다. 평서문으로 해석될 경우 WP에 들어갈 부분이 XP의 자질의 부분집합에 불과하므로 명제가 아무런 정보제공을 하지 못한다. 반면 의문문 자체는 정보제공을 추구하지 않으므로 앞에서 언급한 양의 공리로부터 자유롭다. 셋째, WLWQ의 XP는 주제어 표지 ‘는/-은’을 취하나 주어표지 ‘가/-이’는 취하지 못한다(XP-는/-은 vs. XP-가/-이). 이는 IP내부 에 비공범주의 존재 여부에 따라 C의 음운형태(PF)가 시성이 정해진다는 가설로 설명하고자 했다. WLWQ에 대한 우리의 논의가 옳다면, 본 논문은 다음과 같은 이론적 함의를 기닌다. 첫째, WLWQ의 존재는 생략에 대한 두 이론 즉 LF 복사 이론과 PF 삭제 이론 중 전자의 입장을 지지한다. 둘째, WP를 XP로부터 복원할 때 부분 자질만 복사된다. 이는 어휘가 통사층위로 들어온 이후에도 어휘 자질들이 완전히 동결되는 것이 아니라 계속 지시될 수 있다는 가설을 지지한다.

  • PDF

생체신호를 이용한 안드로이드 플랫폼 기반의 효율적인 스마트 실내 감성조명 제어 시스템 (An Efficient Smart Indoor Emotional Lighting Control System based on Android Platform using Biological Signal)

  • 윤수정;홍성일;인치호
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.199-207
    • /
    • 2016
  • 본 논문에서는 안드로이드 플랫폼 기반의 스마트 감성조명 제어 시스템을 제안한다. 제안된 스마트 실내 감성조명 제어 시스템은 생체신호 측정기기와 이동식 스마트 월 패드, 조명 드라이버, 조명기기로 구성하였다. 제어 시스템은 생체신호를 측정하여 감정어휘를 추출하고, 월 패드에서 블루투스를 이용하여 각 조명 드라이버에 제어신호를 조명 드라이버에 전송하며, 조명 드라이버는 제어신호와 주변의 조도정보를 수집하여 확장보드를 통해 조명기기를 제어하도록 설계하였다. 이때, 월 패드에서는 실내 감성조명 제어 알고리즘에 의한 수동제어와 생체신호 모드 선택이 가능하고, 원하는 조명을 선택하여 부분적인 제어도 가능하게 제어 프로그램을 구현하였다. 제안된 스마트 실내 감성조명 제어 시스템의 실험 결과, 필요로 하는 영역의 조명기기에 대하여 선택적 제어와 색온도 가변에 의한 수동 제어와 생체신호 및 감성어휘에 의한 효율적 가변점등을 할 수 있었다. 따라서 상황에 적합한 색상과 밝기를 제어하여 실내 공간 업무 행위에 있어 집중력 및 업무능력 향상을 위한 효과적인 제어가 가능하였다. 그리고 기존 감성조명 제어 시스템보다 전력 소비 및 디머전압, 전격전류를 감소시켰다.