• 제목/요약/키워드: 단어산출

검색결과 83건 처리시간 0.027초

사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용 (A Collaborative Filtering System Combined with Users' Review Mining : Application to the Recommendation of Smartphone Apps)

  • 전병국;안현철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.1-18
    • /
    • 2015
  • 협업 필터링은 학계나 산업계에서 우수한 성능으로 인해 많이 사용되는 추천기법이지만, 정량적 정보인 사용자들의 평가점수에만 국한하여 추천결과를 생성하므로 간혹 정확도가 떨어지는 문제가 발생한다. 이에 새로운 정보를 추가로 고려하여, 협업 필터링의 성능을 개선하려는 연구들이 지금까지 다양하게 시도되어 왔다. 본 연구는 최근 Web 2.0 시대의 도래로 인해 사용자들이 구입한 상품에 대한 솔직한 의견을 인터넷 상에 자유롭게 표현한다는 점에 착안하여, 사용자가 직접 작성한 리뷰를 참고하여 협업 필터링의 성능을 개선하는 새로운 추천 알고리즘을 제안하고, 이를 스마트폰 앱 추천 시스템에 적용하였다. 정성 정보인 사용자 리뷰를 정량화하기 위해 본 연구에서는 텍스트 마이닝을 활용하였다. 구체적으로 본 연구의 추천시스템은 사용자간 유사도를 산출할 때, 사용자 리뷰의 유사도를 추가로 반영하여 보다 정밀하게 사용자간 유사도를 산출할 수 있도록 하였다. 이 때, 사용자 리뷰의 유사도를 산출하는 접근법으로 중복 사용된 색인어의 빈도로 산출하는 방안과 TF-IDF(Term Frequency - Inverse Document Frequency) 가중치 합으로 산출하는 2가지 방안을 제시한 뒤 그 성능을 비교해 보았다. 실험결과, 제안 알고리즘을 통한 추천, 즉 사용자 리뷰의 유사도를 추가로 반영하는 알고리즘이 평점만을 고려하는 전통적인 협업 필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인할 수 있었다. 아울러, 중복 사용 단어의 TF-IDF 가중치의 합을 고려했을 때, 단순히 중복 사용 단어의 빈도만을 고려했을 때 보다 조금 더 나은 예측정확도를 얻을 수 있음도 함께 확인할 수 있었다.

모국어와 외국어의 단어산출 및 언어 간 전환에 따른 뇌 활성화 과정 (Neural bases underlying Native or Foreign word production, and Language switching)

  • 김충명
    • 한국산학기술학회논문지
    • /
    • 제16권3호
    • /
    • pp.1707-1714
    • /
    • 2015
  • 본 연구는 사건관련 fMRI를 이용하여 언어 내 및 언어 간 그림명명 과제를 수행하는 동안 모국어와 외래어 명사관련 피질 활성화 영역을 비교해 보고, 특히 외래어의 활성화 패턴이 모국어에 동조되는지를 알아보았다. 아울러 과제수행 언어가 정해지지 않은 임의적 언어전환 조건에 관여하는 활성화 영역도 연구대상이었다. 실험결과, 한 가지 수행언어만으로 제한되는 과제에서는 모국어 및 외래어 모두 좌측 하전두회(LIFG) 활성화가 일어났으나 모국어의 활성화 정도가 더 컸으며, 특히 외래어 명명 시 모국어와의 활성화 강도는 약화된 반면 영역분포는 유사한 결과를 얻었다. 이는 외래어가, 외국어가 아닌 모국어에 동조되었음을 시사한다 하겠다. 마지막으로 언어전환 조건에서의 실험에서는 좌측 하전두피질 외에 우측 중전두피 질이 관여함을 발견함으로써 실험수준이 아닌 일상수준의 다언어 사용에 있어, 의식이전의 언어 간 부호전환에 관여하는 우반구의 상대적인 기여와 역할을 시사하는 결과를 얻었다.

학습자 언어 인지 능력 기반의 외국어 능숙도 측정 방법 설계 및 개발 (Design and Development of the Second language Proficiency Method based on Cognitive Ability of Learner)

  • 양영욱;이새벽;임희석
    • 디지털융복합연구
    • /
    • 제11권3호
    • /
    • pp.363-369
    • /
    • 2013
  • 본 논문은 뇌에서 발생하는 언어와 관련된 현상들을 모델링하여 외국어 능숙도 측정 방법을 설계 및 개발하였다. 이 방법은 인지 심리학에서 인지능력을 측정하는 방법에 기반하며, 어휘 판단 과제, 언어 점화 과제, 구어 작업 기억 능력 측정 과제로 나뉜다. 어휘 판단 과제는 자극에 대해 단어인지 비 단어인지를 얼마나 빠르게 판단하는 지를 측정한다. 어휘 판단 과제는 세부적으로 자극의 형태에 따라 읽기와 듣기로 나뉜다. 언어 점화 과제는 언어의 산출 능력을 측정한다. 언어 점화 과제는 자극에 따라 의미적 점화 과제, 번역 점화 과제로 나뉜다. 구어 작업 기억 능력은 학습자의 단기 기억력을 측정한다. 본 논문에서는 제2외국어에 대한 학습자의 언어 인지능력을 사용하여 외국어 능숙도를 측정하는 방법을 제안한다.

용어 클러스터링을 이용한 단일문서 키워드 추출에 관한 연구 (A Study on Keyword Extraction From a Single Document Using Term Clustering)

  • 한승희
    • 한국문헌정보학회지
    • /
    • 제44권3호
    • /
    • pp.155-173
    • /
    • 2010
  • 이 연구에서는 용어 클러스터링을 이용하여 단일문서의 키워드를 추출하는 알고리즘을 제안하고자 한다. 단락단위로 분할한 단일문서를 대상으로 1차 유사도와 2차 분포 유사도를 산출하여 용어 클러스터링을 수행한 결과, 50단어 단락에서 2차 분포 유사도를 적용했을 때 가장 우수한 성능을 나타냈다. 이후, 용어 클러스터링결과를 이용하여 단일문서의 키워드를 추출하기 위해 단순빈도와 상대빈도의 조합을 통해 다양한 키워드 추출 공식을 도출, 적용한 결과, 단락빈도(pf)와 단어빈도$\times$역단락빈도($tf{\times}ipf$) 조건에서 가장 우수한 결과를 나타냈다. 이 결과를 통해, 본 연구에서 제안한 알고리즘은 좋은 키워드가 가져야 할 두 가지 조건인 주제성과 고른 빈도분포라는 측면에서 단일문서를 대상으로 효과적으로 키워드를 추출할 수 있음을 확인하였다.

딥러닝 자동 분류 모델을 위한 공황장애 소셜미디어 코퍼스 구축 및 분석 (Building and Analyzing Panic Disorder Social Media Corpus for Automatic Deep Learning Classification Model)

  • 이수빈;김성덕;이주희;고영수;송민
    • 정보관리학회지
    • /
    • 제38권2호
    • /
    • pp.153-172
    • /
    • 2021
  • 본 연구는 공황장애 말뭉치 구축과 분석을 통해 공황장애의 특성을 살펴보고 공황장애 경향 문헌을 분류할 수 있는 딥러닝 자동 분류 모델을 만들고자 하였다. 이를 위해 소셜미디어에서 수집한 공황장애 관련 문헌 5,884개를 정신 질환 진단 매뉴얼 기준으로 직접 주석 처리하여 공황장애 경향 문헌과 비 경향 문헌으로 분류하였다. 이 중 공황장애 경향 문헌에 나타난 어휘적 특성 및 어휘의 관계성을 분석하기 위해 TF-IDF값을 산출하고 단어 동시출현 분석을 실시하였다. 공황장애의 특성 및 증상 간의 관련성을 분석하기 위해 증상 빈도수와 주석 처리된 증상 번호 간의 동시출현 빈도수를 산출하였다. 또한, 구축한 말뭉치를 활용하여 딥러닝 자동 분류 모델 학습 및 성능 평가를 하였다. 이를 위하여 최신 딥러닝 언어 모델 BERT 중 세 가지 모델을 활용하였고 이 중 KcBERT가 가장 우수한 성능을 보였다. 본 연구는 공황장애 관련 증상을 겪는 사람들의 조기 진단 및 치료를 돕고 소셜미디어 말뭉치를 활용한 정신 질환 연구의 영역을 확장하고자 시도한 점에서 의의가 있다.

이독성을 통한 초등학교 5, 6학년 영어 교과서 읽기 지문의 연계성 분석 (Analysis of the Continuity of Reading Passages in the 5th and 6th Grade Elementary School English Textbooks Based on Readability)

  • 장한결;이제영
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.116-124
    • /
    • 2022
  • 본 연구의 목적은 초등학교 5, 6학년 영어 교과서에 수록된 읽기 지문의 이독성을 분석하여 학년 간 수직적 연계성과 출판사 간 수평적 연계성을 살펴보는 것이다. 이를 위해 10종의 교과서에 수록된 읽기 지문을 코퍼스로 구축한 후, Coh-Metrix를 통해 각 교과서에 수록된 읽기 지문의 이독성을 분석하였다. 또한 일원배치 분산분석을 통해 산출된 이독성에 학년 간, 출판사 간에 통계적으로 유의한 수준의 차이가 있는지 살펴보았다. 이를 통해 얻어진 결과는 다음과 같다. 첫째, 동일 학년 내 읽기 지문의 출판사간 난이도 차이를 분석하여 수평적 연계성을 살펴본 결과 RDL2 지수에서 5학년 교과서간에 유의한 차이가 있었다. 둘째, 출판사 내에서의 학년 간 수직적 연계성을 분석한 결과 FRE와 FKGL 기준으로 교과서 A의 난이도가 5학년에 비해 6학년에서 높았으며, 이는 통계적으로 유의한 수준의 차이였다. 반면 RDL2를 기준으로 했을 경우 교과서 B의 난이도가 5학년에 비해 6학년에서 더 낮아지는 결과를 보았다. 이러한 결과는 FRE와 FKGL은 문장 길이와 단어 길이 중심으로 이독성을 산출하는 반면, RDL2는 내용어 중복, 단어 빈도 수, 문장의 통사적 유사성 등을 기초로 하고 있기 때문으로 보인다.

뇌성마비 마비말장애 성인의 파찰음 실현 양상 분석 (Acoustic analysis of Korean affricates produced by dysarthric speakers with cerebral palsy)

  • 문지현;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.45-55
    • /
    • 2021
  • 본 연구는 경직형 경도-중등도 뇌성마비 마비말장애 성인이 산출한 한국어 파찰음의 음향학적인 특징을 분석한다. 한국어의 마찰음과 파찰음은 조음오류가 빈번하게 발생하는 자음인데, 기존 연구들은 마찰음에만 집중했다. 따라서 본 연구에서는 마비말장애 화자가 산출한 파찰음을 음향학적으로 분석하고자 한다. QoLT_SPEECH_2014 데이터베이스 내에서 파찰음 /tɕ, tɕh, ͈tɕ/이 어두 초성 및 어중 초성에 위치하는 단어를 선정하여 경도-중등도 경직형 장애 남성 화자 6명과 비장애 남성 화자 5명의 발화 데이터를 분석에 사용하였다. 한국어의 파찰음의 특성을 고려하여 파찰음의 음향학적 특징을 나타내는 매개변수를 선정하여 분석을 시행하였다: 마찰구간의 길이, 묵음 구간의 길이, 무게중심, 분산, 왜도, 첨도, 중심적률. 분석 결과는 다음과 같다: 1) 어중 초성 파찰음에서 마비말장애인이 유의하게 긴 마찰구간의 길이를 보였다, 2) 마비말장애인이 유의하게 긴 묵음 구간의 길이를 보였다, 3) 무게중심의 경우 두 집단 간의 유의한 차이가 존재하지 않았다, 4) 마비말장애인이 유의하게 큰 왜도 값을 보였다, 5) 마비말장애인이 유의하게 큰 중심적률 값을 보였다. 본 연구는 마비말장애인이 산출한 파찰음의 특성을 분석하고, 비장애인이 산출한 파찰음과의 차이를 밝혔다.

국내 인지행동치료 연구의 지식구조: 동시출현단어 분석 (Knowledge Structure of Cognitive Behavioral Therapy Studies in Korea: Co-word Analysis)

  • 김도희;김현진;안다혜
    • 디지털융복합연구
    • /
    • 제17권12호
    • /
    • pp.509-521
    • /
    • 2019
  • 본 연구는 인지행동치료(Cognitve Behavioral Therapy: CBT)분야 학술지에서 나타난 키워드의 출현패턴을 조사하여 국내 CBT 연구의 지식구조를 규명하는 데에 목적이 있다. 국내·외에서 수행된 CBT 연구를 비교하고자 '인지행동치료'에서 출판된 논문 234편(2008-2019)과 'Cognitive Therapy and Research'에서 출판된 논문 2,316편(1977-2019)이 수집되었다. 자료는 NetMiner 4.3 프로그램으로 분석되었으며 동시출현단어 분석은 코사인 유사도 행렬을 산출하고, 네트워크를 시각화하는 절차로 수행되었다. 본 연구의 결과로 국내 CBT연구자들의 주요 관심사가 식별되었고, 국내 CBT 지식구조는 9개의 연구영역으로 범주화되었다: '척도 타당화', '완벽주의와 속박감', '조현병 환자의 인지, 정서, 관계적 특성', '경계선 성격장애와 우울/양극성 장애 환자의 인지적 특성과 치료', '적응과 심리적 건강', '사회불안장애 환자의 인지적 특성과 치료', '우울의 원인과 공존이환', '수용전념치료', '폭식 장애 환자의 이해와 치료'. 본 연구는 지난 11년 동안 국내 CBT 분야에서 축적된 지식을 점검하였다는 데에 의의가 있으며 국내 CBT 연구의 향후 발전과제로 임상적 실천 표준을 제고하기 위한 연구가 필요하다고 제안한다.

SW 교육 뉴스데이터의 감성분석 (Sentimental Analysis of SW Education News Data)

  • 박선주
    • 정보교육학회논문지
    • /
    • 제21권1호
    • /
    • pp.89-96
    • /
    • 2017
  • 스마트폰의 대중화로 SNS를 통해 유통되는 정보의 내용과 감성을 분석하는 연구가 활발하게 진행되고 있다. 이에 본 논문에서는 SW 교육에 관한 온라인 뉴스데이터를 수집하여 형태소 분석후 단어를 추출하고 뉴스데이터의 감성지수를 산출하여 수집된 뉴스 데이터의 감성분석을 실시하였다. 또한, 산출된 감성점수가 어느 정도 정확한지 정확도를 검토하였다. 분석 결과 수집기간동안 SW 교육 관련 뉴스는 월평균 약 189건 발생되었으며, 감성점수 평균은 0.7로 SW 교육 관련 뉴스는 긍정적임을 알 수 있었다. SW 교육의 중요성 및 정책 실행에는 공감하며 긍정적이었으나 구체적인 실행 방법에는 부정적인 시각이 있었다. 즉, SW 교육환경 및 교육방법 부족 문제, SW 개발자 양성 및 처우개선 문제, 코딩 사교육 증가 문제 등이었다.

Doc2Vec과 Word2Vec을 활용한 Convolutional Neural Network 기반 한국어 신문 기사 분류 (Categorization of Korean News Articles Based on Convolutional Neural Network Using Doc2Vec and Word2Vec)

  • 김도우;구명완
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.742-747
    • /
    • 2017
  • 본 논문에서는 문장의 분류에 있어 성능이 입증된 word2vec을 활용한 Convolutional Neural Network(CNN) 모델을 기반으로 하여 문서 분류에 적용 시 성능을 향상시키기 위해 doc2vec을 함께 CNN에 적용하고 기반 모델의 구조를 개선한 문서 분류 방안을 제안한다. 먼저 토큰화 방법을 선정하기 위한 초보적인 실험을 통하여, 어절 단위, 형태소 분석, Word Piece Model(WPM) 적용의 3가지 방법 중 WPM이 분류율 79.5%를 산출하여 문서 분류에 유용함을 실증적으로 확인하였다. 다음으로 WPM을 활용하여 생성한 단어 및 문서의 벡터 표현을 기반 모델과 제안 모델에 입력하여 범주 10개의 한국어 신문 기사 분류에 적용한 실험을 수행하였다. 실험 결과, 제안 모델이 분류율 89.88%를 산출하여 기반 모델의 분류율 86.89%보다 2.99% 향상되고 22.80%의 개선 효과를 보였다. 본 연구를 통하여, doc2vec이 동일한 범주에 속한 문서들에 대하여 유사한 문서 벡터 표현을 생성하기 때문에 문서의 분류에 doc2vec을 함께 활용하는 것이 효과적임을 검증하였다.