• 제목/요약/키워드: 핵심단어 분석

검색결과 158건 처리시간 0.027초

언어의 기능적 자기공명영상: 자극방법에 따른 활성화와 편재화의 차이 (Functional MRI of Language: Difference of its Activated Areas and Lateralization according to the Input Modality)

  • 유재욱;조재민;최호철;박미정;최혜영;김지은;한헌;김삼수;전용환;강현수
    • Investigative Magnetic Resonance Imaging
    • /
    • 제15권2호
    • /
    • pp.130-138
    • /
    • 2011
  • 목적 : 시각과 청각을 통한 단어생성과제를 이용하여 언어의 기능적 자기공명영상을 얻고, 자극을 제시한 방법에 따라 활성화되는 뇌영역이나 편재화 차이가 있는 지를 알아보고자 하였다. 대상 및 방법 : 정상성인 남자 8명을 대상으로 하였고 모두 오른손잡이였다. 단어생성과제를 사용하여 언어기능의 활성화를 유도 하였고, 시각과제와 청각과제를 시행하였다. 과제별로 합산된 평균 활성화지도를 얻었고 신호의 유의수준은 p < 0.05로 하였다. 각 과제별로 나타난 활성화 영역을 시각적, 통계학적 방법으로 비교 분석 하였다. 결과 : 시각과제와 청각과제 모두에서 좌측이 우세한 활성화 신호가 나타났으며, 시각과제에서 편재화가 약간 우세하였다. 전두엽(Broca영역, 전운동영역, 보조운동영역)과 좌측 후중측두엽은 두 과제에서 공통적으로 활성화가 나타났다. 청각과제에서는 광범위한 양측 측두엽의 활성화가 있었으며, 시각과제에서는 양측 후두엽과 두정엽의 활성화가 나타났다. 결론 : 자극과 관계없이 공통적으로 활성화된 영역은 언어의 핵심 영역으로, 자극과제별로 다르게 나타난 부분은 자극의 인지와 처리과정에 따른 활성화로 생각된다. 시각과제는 청각과제에 비해 편재화된 활성화를 얻을 수 있었으며 언어의 기능영상에 있어 유용한 방법으로 생각한다.

KISTI 과학기술정보서비스의 콘텐츠 활용 분석 (A Study on the Content Utilization of KISTI Science and Technology Information Service)

  • 강남규;황미녕
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.87-95
    • /
    • 2020
  • 한국과학기술정보연구원(KISTI)가 제공하는 과학기술정보서비스는 일반적인 정보서비스와 유사하게 구축된 콘텐츠를 이용자가 쉽고 편리하게 검색하고 조회할 수 있도록 만들어진 서비스이다. NDSL은 KISTI의 핵심 과학기술정보서비스로서 약 1억 38백만건의 콘텐츠를 제공하고 있으며 2019년 1년간 약 93백만회의 페이지 뷰를 보이고 있다. 본 논문에서는 NDSL이 제공하고 있는 학술논문, 보고서, 특허 등의 과학기술정보가 웹 서비스(https://www.ndsl.kr)를 통해서 어떻게 검색되고 활용되는지와 입력된 검색 질의어 등을 분석을 통해 다양한 인사이트를 도출하였다. 콘텐츠 구축 현황, 콘텐츠 유형별 활용 현황과 활용 방식 등의 일반적인 통계 이외에도 월별/요일별/시간대별 콘텐츠의 이용 행태, 조회수 구간별 활용 콘텐츠의 유형, 콘텐츠 유형별 1회 검색 대비 조회 비율, 학술논문의 발행년도별 이용 현황 비교, 국내 학술논문의 활용과 KCI 영향력 지수와의 관계, 학술논문과 특허 활용에 대한 특징 등 콘텐츠 유형별 활용성에 대한 분석을 진행하였다. 또한 콘텐츠 유형별 검색 질의어의 구성 방식, 질의어의 단어수 분석, 검색 질의어와 시기성의 관계 등의 검색 질의어에 대하여 분석하였으며 NDSL에서는 한글 성명 검색이 많다는 특징도 발견할 수 있었다. 이러한 분석 결과를 토대로 정보시스템 구축 관점에서의 NDSL 서비스 개선 방안을 제안하고자 한다. 본 논문에서는 콘텐츠 활용에 대한 행태 분석 결과를 이용자의 검색 결과에 동적으로 반영, 비로그인 이용자에 대한 식별을 통해 타겟팅 서비스가 가능하도록 시스템을 구축, 질의어 확장하는 등의 것을 NDSL 개선 사항으로 제안하고자 한다.

문헌정보학 분야 핵심 학술지들의 가중 주제-방법 네트워크 분석 (Weighted Subject - Method Network Analysis of Library and Information Science Studies)

  • 이기헌;정효정;송민
    • 한국문헌정보학회지
    • /
    • 제49권3호
    • /
    • pp.457-488
    • /
    • 2015
  • 본 연구는 1990년부터 2014년까지 25년 간 국외 유수 문헌정보학 학술지들에 게재된 논문들을 대상으로 연구 주제와 연구 방법을 구분하여 현 선도 학술지의 연구 누적 현황을 분석하였다. 연구 주제와 연구 방법을 구분하고 그들 간의 관계를 살펴보기 위해 가중 주제-방법 네트워크를 개발하였다. 이는 주제와 방법으로 구성된 네트워크이며, 해당 토픽 소속 단어의 동시 출현 빈도를 기초로 주제와 방법에 가중치를 준다. 본 연구 결과에 따르면, 지난 25년간 경영정보시스템, 정보요구분석, 계량서지연구, 정보정책 등이 상위 연구 주제들이었다. 또한, 모델링, 개념/문헌연구, 연구협업분석, 웹데이터 분석 등이 상위 연구 방법들이었으며, 최근 텍스트 마이닝의 비상이 괄목할 만하다. 빈번히 짝을 이루는 연구 주제들과 연구 방법들의 지난 25년간의 군집들과 최근 5년간의 군집들을 살펴보면, 계량서지연구가 네트워크분석 방법들을 다수 적용하면서 그 저변을 넓히며 자리를 확고하게 하고 있으며, 텍스트 마이닝이 의료정보시스템, 이용자인터페이스에 특화되고 있음을 확인할 수 있다. 이러한 연구 결과는 문헌정보학의 선도 연구자들의 관심 연구 영역과 관점을 확인시켜주고, 향후 문헌정보학 발전을 위한 연구 설계의 기초자료로 활용될 수 있다.

BERT-Fused Transformer 모델에 기반한 한국어 형태소 분석 기법 (Korean Morphological Analysis Method Based on BERT-Fused Transformer Model)

  • 이창재;나동열
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권4호
    • /
    • pp.169-178
    • /
    • 2022
  • 형태소는 더 이상 분리하면 본래의 의미를 잃어버리는 말의 최소 단위이다. 한국어에서 문장은 공백으로 구분되는 어절(단어)의 조합이다. 형태소 분석은 어절 단위의 문장을 입력 받아서 문맥 정보를 활용하여 형태소 단위로 나누고 각 형태소에 적절한 품사 기호를 부착한 결과를 생성하는 것이다. 한국어 자연어 처리에서 형태소 분석은 가장 핵심적인 태스크다. 형태소 분석의 성능 향상은 한국어 자연어 처리 태스크의 성능 향상에 직결된다. 최근 형태소 분석은 주로 기계 번역 관점에서 연구가 진행되고 있다. 기계 번역은 신경망 모델 등으로 어느 한 도메인의 시퀀스(문장)를 다른 도메인의 시퀀스(문장)로 바꾸는 것이다. 형태소 분석을 기계 번역 관점에서 보면 어절 도메인에 속하는 입력 시퀀스를 형태소 도메인 시퀀스로 변환하는 것이다. 본 논문은 한국어 형태소 분석을 위한 딥러닝 모델을 제안한다. 본 연구에서 사용하는 모델은 기계 번역에서 높은 성능을 기록한 BERT-fused 모델을 기반으로 한다. BERT-fused 모델은 기계 번역에서 대표적인 Transformer 모델과 자연어 처리 분야에 획기적인 성능 향상을 이룬 언어모델인 BERT를 활용한다. 실험 결과 형태소 단위 F1-Score 98.24의 성능을 얻을 수 있었다.

보도기사의 재산권적 가치와 무단전재를 통한 저작권 침해에 관한 연구 (A Study on the Property Values of News Articles and Copyright Infringement)

  • 김경호
    • 한국언론정보학보
    • /
    • 제39권
    • /
    • pp.324-354
    • /
    • 2007
  • 공공의 영역에 속하는 뉴스의 사실 자체는 공기처럼 자유로운 것이지만, 이것이 노동과 자본의 투자로 뉴스로 전환되었을 때, 상업성이 인정되는 재산권적 가치를 갖게 되며, 이를 생산한 언론사는 배타적 권리를 갖게 된다. 상품으로서 뉴스는 재산인 것이다. 재판부도 이러한 취지에 부합하게 사실보도에 대한 저작권 보호의 범위를 넓게 인식할 필요가 있다. 법으로 보호되는 것은 표현의 방법, 사건에 대한 기자의 분석과 해석, 문장의 구성과 자료의 배열, 단어의 선택, 특정한 부분에 주어진 강조 등이다. 즉, 침해의 핵심은 일반적인 주제나 사건 보도에 있는 것이 아닌 취급의 유사성이나 표현 방법의 착취에 있다. 보도기사가 사실적 요소들을 열거하여 정보를 전달하고 있지만, 소재의 선택과 문장 속에서의 용어의 배열, 강조 등은 학문이나 예술과 같은 고도의 창작성을 갖는 것은 아니지만, 낮은 정도의 창작활동에 속하는 것이다. 따라서 보도기사를 단순한 사실의 전달에 머물러 창작성이 결여되었다고 판단하는 것은 저작권법 원래 취지와도 배치되는 것이다.

  • PDF

Performance Comparison of Korean Dialect Classification Models Based on Acoustic Features

  • Kim, Young Kook;Kim, Myung Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.37-43
    • /
    • 2021
  • 말소리의 음향 특징을 이용하여 화자에 대한 중요한 사회, 언어학적 정보를 얻을 수 있는데 그 중 한 가지 핵심 특징은 방언이다. 화자의 방언 사용은 컴퓨터와의 상호작용을 방해하는 주요 요소이다. 방언은 발화의 음소, 음절, 단어, 문장 및 구와 같이 다양한 수준에서 구분할 수 있지만 이를 하나하나 식별하여 방언을 구분하기는 어렵다. 이에 본 논문에서는 음성 데이터의 특성 중 MFCC만 사용하는 경량화된 한국어 방언 분류 모델을 제안한다. 한국인 대화 음성 데이터를 통해 MFCC 특징을 활용하는 최적의 방법을 연구하고, 8가지 머신 러닝 및 딥러닝 분류 모델에서 경기/서울, 강원, 충청, 전라, 경상 5개의 한국어 방언 분류 성능을 비교한다. MFCC를 정규화하는 방법으로 대부분의 분류 모델에서 성능을 향상시켰으며, MFCC를 정규화하기 전 분류 모델의 최고 성능과 비교하여 정확도는 1.07%, F1-score는 2.04% 향상된 성능을 기록하였다.

다양한 언어적 자질을 고려한 발화간 유사도 측정 방법 (A Method for Measuring Inter-Utterance Similarity Considering Various Linguistic Features)

  • 이연수;신중휘;홍금원;송영인;이도길;임해창
    • 한국음향학회지
    • /
    • 제28권1호
    • /
    • pp.61-69
    • /
    • 2009
  • 본 연구는 예제 기반 대화 시스템에서 응답을 결정하기 위한 핵심 요소 기술 중 하나인 발차간 유사도 측정 방법의 개선에 대해 논한다. 일반적인 문장간 유사도 측정과는 달리, 대화에서 발차간 유사도 측정은 단어 분포간 유사도 뿐만 아니라, 문형, 시제, 긍/부정, 양태등 대화 자연스러움을 결정하는 문장의 다양한 언어적 요소 역시 중요하게 고려되어야 한다. 그러나 기존 연구에서는 이에 대한 고려가 부족 했던 것이 사실이며, 따라서 본 연구에서는 개선 방안으로서 발화의 형태적 유사성 뿐 아니라 다양한 언어적 자질들을 분석하고 이를 유사도 측정에 반영하여 정확도를 향상시키는 새로운 유사도 측정 방법을 제안한다. 또한, 발차의 자질별 유사도를 고려함으로써, 한정된 수의 예제들의 활용도를 높일 수 있는 방법을 제안하였다. 실험 결과 제안하는 방법이 기존 방식에 비해 10%p 이상 정확도 성능 향상이 있었다.

문헌정보학 분야의 리터러시 연구 동향 분석 (A Study on the Research Trends on Literacy in Library and Information Science)

  • 장수현;남영준
    • 정보관리학회지
    • /
    • 제39권3호
    • /
    • pp.263-292
    • /
    • 2022
  • 본 연구는 문헌정보학 현장인 도서관에서 제공되는 서비스인 이용자 교육의 관련 개념인 리터러시가 각종 문헌정보학 연구 분야에서 어떠한 연구 주제를 다루는지 확인하는 것을 목적으로 한다. 이를 위해 WoS와 KCI 데이터베이스에서 문헌정보학 분야 리터러시 관련 논문을 수집하여 키워드 분석 및 토픽 모델링 분석 기법을 상호보완적으로 사용해 분석하였다. 분석 결과, WoS와 KCI의 문헌정보학 분야 리티러시 관련 연구 동향은 저자 키워드, 주요 주제 등에서 차이가 있는 것으로 나타났으며, 토픽 모델링을 통해 KCI의 리터러시 관련 연구를 3개의 토픽으로 분류하였다. 또한, 연구에서 확인한 국내 문헌정보학 분야 리터러시 연구 동향은 전체 리터러시 관련 연구 동향과 연구량 급증 시기, 핵심 다빈출 키워드 차이가 있음을 분석하였다. 특히, 전체 분야 리터러시 연구는 '리터러시', '교육', '미디어', '디지털' 등의 단어가 다수 도출되었지만 문헌정보학 분야의 리터러시 연구는 '정보활용능력', '학교도서관' 등의 키워드가 다수 등장하였다. 이를 바탕으로 향후 국내에서도 정보가 급증하는 오늘날의 정보화 환경에 맞춰 정보에 대한 평가적인 안목을 기를 수 있는 능력에 관한 연구가 필요하다는 결론을 도출하였다.

데이터 세트별 Post-Training을 통한 언어 모델 최적화 연구: 금융 감성 분석을 중심으로 (Optimizing Language Models through Dataset-Specific Post-Training: A Focus on Financial Sentiment Analysis)

  • 정희도;김재헌;장백철
    • 인터넷정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.57-67
    • /
    • 2024
  • 본 연구는 금융 분야에서 중요한 증감 정보를 효과적으로 이해하고 감성을 정확하게 분류하기 위한 언어 모델의 학습 방법론을 탐구한다. 연구의 핵심 목표는 언어 모델이 금융과 관련된 증감 표현을 잘 이해할 수 있게 하기 위한 적절한 데이터 세트를 찾는 것이다. 이를 위해, Wall Street Journal에서 수집한 금융 뉴스 문장 중 증감 관련 단어를 포함하는 문장을 선별했고, 이와 함께 적절한 프롬프트를 사용해 GPT-3.5-turbo-1106으로 생성한 문장을 각각 post-training에 사용했다. Post-training에 사용한 데이터 세트가 언어 모델의 학습에 어떠한 영향을 미치는지 금융 감성 분석 벤치마크 데이터 세트인 Financial PhraseBank를 통해 성능을 비교하며 분석했으며, 그 결과 금융 분야에 특화된 언어 모델인 FinBERT를 추가 학습한 결과가 일반적인 도메인에서 사전 학습된 모델인 BERT를 추가 학습한 것보다 더 높은 성능을 보였다. 또 금융 뉴스로 post-training을 진행한 것이 생성한 문장을 post-training을 진행한 것에 비해 전반적으로 성능이 높음을 보였으나, 일반화가 더욱 요구되는 환경에서는 생성된 문장으로 추가 학습한 모델이 더 높은 성능을 보였다. 이러한 결과는 개선하고자 하는 부분의 도메인이 사용하고자 하는 언어 모델과의 도메인과 일치해야 한다는 것과 적절한 데이터 세트의 선택이 언어 모델의 이해도 및 예측 성능 향상에 중요함을 시사한다. 연구 결과는 특히 금융 분야에서 감성 분석과 관련된 과제를 수행할 때 언어 모델의 성능을 최적화하기 위한 방법론을 제시하며, 향후 금융 분야에서의 더욱 정교한 언어 이해 및 감성분석을 위한 연구 방향을 제시한다. 이러한 연구는 금융 분야 뿐만 아니라 다른 도메인에서의 언어 모델 학습에도 의미 있는 통찰을 제공할 수 있다.

초등과학부진학생의 기초과학탐구능력 향상을 위한 중재프로그램 개발 -안구운동을 중심으로- (The Development of Intervention Program for Enhancing Elementary Science-Poor Students' Basic Science Process Skills - Focus on Eye Movement Analysis -)

  • 신원섭;신동훈
    • 한국과학교육학회지
    • /
    • 제34권8호
    • /
    • pp.795-806
    • /
    • 2014
  • 이 연구는 초등과학부진학생들의 기초과학탐구능력을 향상하기 위해 중재프로그램을 개발하고 안구추적기를 활용해 중재프로그램의 효과를 검증하는데 있다. 연구 참여자는 초등과학부진학생 35명이었다. 안구운동추적기는 SMI사의 iView XTM RED로 고정형이고 샘플링 속도는 120 Hz이었다. 실험을 설계하고 분석하기 위해 Experiment 3.4와 BeGaze 3.4 프로그램을 사용하였다. 연구결과는 다음과 같다. 첫째 기초탐구 교수전략, 교사 학생 행동, 교수-학습지도안, 학습 활동지를 포함하여 중재프로그램을 개발하였다. 둘째, 중재프로그램 적용결과 기초과학탐구능력이 향상되었고 전체 문제해결시간이 통계적으로 유의미하게 줄어들었다. 셋째, 기초과학탐구 문제영역과 핵심단어에 대한 평균응시시간이 통계적으로 유의미하게 감소하였다. 넷째, 기초과학탐구문제해결과정에서 동공 크기(pupil diameter)가 통계적으로 유의미하게 확장되었다. 다섯째, 기초과학탐구문제해결과정에서 평균도약시간(average saccade time)은 통계적으로 유의미하게 증가하였다. 여섯째, 문제 단서영역에 대한 평균응시도입시간(average fixation entry time)은 통계적으로 유의미하게 빨라졌고, 평균응시시간은 통계적으로 유의미하게 줄어들었다.