• 제목/요약/키워드: 논문주제

검색결과 3,305건 처리시간 0.033초

Labeled LDA를 이용한 저자 주제어 추천 (Applying Labeled LDA to Author Keywords Recommendation)

  • 봉성용;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.385-389
    • /
    • 2010
  • 논문에 부여되는 저자 주제어(author keyword)는 논문을 분류 및 검색하는데 활용될 수 있다. 이렇게 주제어를 부여할 때 자동으로 저자 주제어를 추천한다면 사용자에게 편리성을 제공하고 저자가 직접 부여한 저자 주제어 이외에 추가적으로 주제어가 있는지도 확인할 수 있어 유용하다. 본 연구에서는 논문에 달려있는 다수의 주제어 중 하나의 주제어를 선별하여 Labeled LDA를 이용해 주제어와 초록(abstract)의 관계를 학습했다. 이후 초록이 주어지면 자동으로 저자 주제어를 부여할 수 있도록 추천하는 기법을 제안하고 그에 따른 실험을 진행했다. 본 논문에서는 실험을 통하여 기계학습을 이용한 저자 주제어의 추천이 어느 정도의 성능을 보이는지 평가하고 향후 연구의 방향을 제시한다.

  • PDF

과학기술분야 학위논문 내용목차에 따른 주제어 출현빈도에 관한 연구 (A Study on Frequency of Subject on Content of Thesis in Field of Science and Technology)

  • 이혜영;곽승진
    • 정보관리학회지
    • /
    • 제25권1호
    • /
    • pp.191-210
    • /
    • 2008
  • 일반적으로 문헌을 검색하고 접근하기 위하여 주제색인과 같은 주제어를 활용하곤 한다. 그렇다면 문헌의 내용과 문헌의 주제어는 분명히 어떤 밀접한 상관관계가 있을 것으로 예측해볼 수 있다. 본 연구는 이러한 의문점에서 출발하여, 디지털콘텐트의 본문내용이 비교적 짜임새 있게 정형화되어 있는 석사 학위논문을 연구문헌으로 한정하여 학위논문 전문에서 나타나는 학위논문의 주제어 분포도를 연구하였다. 학위논문의 주제어는 논문 저자가 부여한 주제어를 사용하되, 학위논문 전문은 '목차', '서론', '이론배경', '본론', '결론', '참고문헌'의 내용위치로 분할하여 내용위치에 따른 주제어의 출현율을 확인하였다. 연구대상 학위논문 전문은 1226.3개의 용어, 5152.3번의 용어 출현을 보였다. 학위논문 저자가 부여한 주제어는 $12{\sim}13$개 용어로 구성되어 있었다. 연구결과, 전문 내용위치에 따른 주제어의 출현율은 '목차' 11.4%와 '서론' 11.2%에서 가장 높았으며(11%), 다음 순위는 내용위치 '결론' 9.8%이었다.

이용자 관련 연구논문에 대한 주제어 분석 (A Keyword analysis on the 'user' related research papers : In Library and Information Science)

  • 박선미;오경묵
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.43-46
    • /
    • 2013
  • 본 연구에서는 국내 문헌정보학 분야의 연구 논문 중 이용자 관련 연구 논문 125편을 대상으로 논문에 부여된 주제어간의 연결 관계를 분석 하였다. 사전 작업을 통하여 정리된 226개의 주제어에 대한 연결 관계를 네트워크 분석을 통하여 분석하고 시각화 하였다. 그래프를 통하여 주제어간 연결 강도를 확인하였고, 다른 주제어와 연결성이 높은 상위 20개의 주제어를 제시하였다. 주제어간 근접성이 높은 주제어를 군집화한 결과 14개의 군집으로 정리되었다. 다른 주제어와 연결이 없이 고립된 군집이 8개, 연결된 군집이 6개였다.

  • PDF

위키피디아를 이용한 반자동 학습 기반의 cQA 서비스 주제 분류 시스템 (A Topic Classification System in cQA Services Based on Semi-Automatic Learning Using Wikipedia)

  • 김태현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-141
    • /
    • 2015
  • 본 논문은 커뮤니티 기반의 질의-응답 서비스에서 사용자 질의의 주제를 분류하는 시스템을 소개한다. 커뮤니티 기반의 질의-응답 서비스는 분야에 따라 다양한 주제를 가질 수 있으며 오늘 날 사용자 질의의 주제 분류에는 통계 기반의 분류 방법이 많이 이용되고 있다. 통계 기반의 분류 방법으로 사용자 질의를 분류하기 위해서는 주제에 적합한 대량의 학습 말뭉치가 필요하다. 주제에 적합한 대량의 학습 말뭉치를 사람이 직접 구축하는 것은 많은 시간과 비용이 든다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 위키피디아 문서를 Supervised K-means Clustering 기법으로 주제별로 분류함으로써 학습 말뭉치를 반자동으로 구축하는 방법을 제안한다. 그 다음, 생성된 학습 말뭉치로 지지 벡터 기계를 학습하여 사용자 질의의 주제를 분류하게 된다. 위키피디아 문서와 사용자 질의는 다른 도메인의 문서임에도 불구하고 본 논문의 시스템으로 사용자 질의의 주제를 분류한 결과 77.33%의 정확도를 보였다.

  • PDF

키워드 가중치 방식에 근거한 도서 본문 주제어 추출 (Thematic Word Extraction from Book Based on Keyword Weighting Method)

  • 안희정;최건희;김승훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.19-22
    • /
    • 2015
  • 본 논문에서는 문장 및 문단에서 키워드의 역할에 따른 가중치에 근거하여 도서 본문에서 주제어를 추출하는 방법을 제안한다. 기존의 주제어 추출 방식은 도서 본문이 아닌 신문이나 논문에 대한 방식이므로 도서 본문에서의 주제어 추출에 그대로 적용하기에는 어려움이 있다. 따라서 본 논문에서는 빈도수뿐만 아니라 문장 내 중요 요소에 대한 가중치와 중요 문장에 대한 가중치를 후보 키워드에 부여하는 방식을 제안하였다. 제안한 계산 방식을 비문학 도서에 대하여 실험한 결과, 빈도수만으로 주제어를 추출한 기존 방식보다 본 논문에서 제안한 방식의 주제어 추출 결과의 정확도가 향상되는 것을 확인하였다.

  • PDF

국내 학술논문 주제 분류 알고리즘 비교 및 분석 (Comparison and Analysis of Subject Classification for Domestic Research Data)

  • 최원준;설재욱;정희석;윤화묵
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.178-186
    • /
    • 2018
  • 학술정보 성과물을 서비스하기 위하여 논문 단위의 주제 분류는 필수가 된다. 하지만 현재까지 저널 단위의 주제 분류가 되어 있으며 기사 단위의 주제 분류가 서비스되는 곳은 많지 않다. 국내 성과물 중에서 학술 논문의 경우 주제 분류가 있으면 좀 더 큰 영역의 서비스를 담당할 수 있고 범위를 정해서 서비스 할 수 있기 때문에 무엇보다 중요한 정보가 된다. 하지만, 분야 별 주제를 분류하는 문제는 다양한 분야의 전문가의 손이 필요하고 정확도를 높이기 위해서 다양한 방법의 검증이 필요하다. 본 논문에서는 정답이 알려져 있지 않은 상태에서의 정답을 찾는 비지도 학습 알고리즘을 활용해서 주제 분류를 시도해 보고 연관도와 복잡도를 활용해서 주제 분류 알고리즘의 결과를 비교해 보고자 한다. 비지도 학습 알고리즘은 주제 분류 방법으로 잘 알려진 Hierarchical Dirichlet Precess(HDP). Latent Dirichlet Allocation(LDA), Latent Semantic Indexing(LSI) 알고리즘을 활용하여 성능을 분석해 보았다.

대학도서관 서비스를 위한 서지분석기반 학과의 주제적 특성 분석 연구 (Bibliometric Analysis to Analyze Topic Areas of Faculty for Academic Library Service)

  • 최상희
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.237-258
    • /
    • 2013
  • 대학소속 연구자들의 연구 분야가 다변화되면서 대학도서관에서는 서비스 운영을 위하여 학과별 주제 분야를 파악하는 것이 중요한 과제로 인식되고 있다. 이 연구는 대학 학과 소속구성원들의 학술지 논문 서지사항을 분석하여 학과별 주제특성을 다차원적으로 분석하고자 하였다. 게재한 학술논문을 분석하여 1차적으로 해당 학과의 주제영역을 파악하고자 하였으며 심층적으로 주제영역을 분석하기 위하여 해당 논문들이 인용한 학술지를 조사하여 확장된 주제영역을 조사하였다. 또한 상위 인용된 학술지를 대상으로 네트워크 분석을 하여 학술지간 관계를 분석하였다. 분석 결과 학과별 주제 분야별 학술지 이용현황에 차이가 있는 것으로 조사되었으며 특정 주제 분야의 경우 학술지 종수와 논문 수에 따라 주제 분야의 중요도가 비례하지 않는 것으로 나타났다. 즉, 특정분야의 경우 소수의 학술지에서 많은 논문이 인용되고 있는 현상이 있으며 게재하는 주제 분야와 인용하는 주제 분야의 중요도가 일치하지 않는 것으로 나타났다.

인스턴트 메시징에서의 대화 주제 및 주제 전환 탐지 (Topic and Topic Change Detection in Instance Messaging)

  • 최윤정;신욱현;정윤재;맹성현;한경수
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권7호
    • /
    • pp.59-66
    • /
    • 2008
  • 본 논문에서는 인스턴트 메시징(Instant Messaging), 채팅과 같은 텍스트 기반의 대화에서 현재 발화를 기준으로 대화의 주제를 파악하고, 대화 주제 전환 여부를 판단하는 기법에 대해 기술한다. 대화는 다른 종류의 글과 다르게 길이가 매우 짧아 적은 수의 단어를 사용하고, 두 사람 이상이 참여를 하며, 대화의 이력(History)이 현재의 발화에 영향을 미친다. 이러한 특성에 따라 본 논문에서는 사용자 발화 뿐 아니라 대화 상대자의 발화에서 추출한 키워드 기반으로 주제 탐지를 하며, 대화의 이력도 고려하여 대화 주제 탐지의 정확도를 높힌 연구 결과를 기술한다. 대화주제 전환 탐지는 이전 발화와 현재 발화에서 탐지된 주제의 유사성을 계산하여, 유사성이 낮은 경우에 전환 탐지가 이루어졌다고 판단하였다. 본 논문의 실험에서 대화 주제 탐지는 88.20%. 대화 주제 전환 탐지는 87.36%의 정확도를 얻었다.

  • PDF

직업무용단체 정기공연의 주제경향 분석 (Analyze Theme Trend for Subscription Performance of Professional Dance Groups)

  • 심다솜;김선정
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.136-148
    • /
    • 2013
  • 본 연구는 우리나라의 무용단 중 한국무용을 대표할 수 있는 국립무용단, 서울시무용단, 경기도립무용단의 정기공연작품의 주제경향 분석을 통해 무용이 사회와 어떠한 관계를 지녔는지 작품의 주제경향으로 시대별 사회의 흐름을 유추하여 무용과 사회의 구조관계를 조사하고, 무용작품의 주제에 대한 의미를 각인시켜 후속연구에 기반을 제공함에 연구의 목적이 있다. 이 연구의 목적을 수행하기 위하여 선행연구 및 관련서적을 참고한 문헌조사를 중심으로 국립무용단, 서울시무용단, 경기도립무용단 세 무용단으로 선정하여 각 무용단의 창단부터 현재까지의 정기공연을 팜플렛, 신문기사, 무용단의 공연자료 및 관련된 선행논문을 통해 정기공연의 주제를 조사하였다. 자료분석은 주제경향 선행논문에서 공통적으로 사용된 김병석의 분류방법에 따라 무용단의 창단부터 현재까지 공연된 정기공연 내용과 주제를 중심으로 1) 전통의식적 주제, 2) 문학적인 주제, 3) 역사적인 주제, 4) 추상적인 주제, 5) 현실적인 주제, 6) 사회적인 주제로 분류하였다.

국내 학술지 논문의 주제어를 통한 학술연구분야 관계분석 (Relation Analysis Among Academic Research Areas Using Subject Terms of Domestic Journal Papers)

  • 이혜영;곽승진
    • 한국비블리아학회지
    • /
    • 제22권3호
    • /
    • pp.353-371
    • /
    • 2011
  • 본 연구의 목적은 국내 연구자들의 연구 성과물인 학술지 논문에 나타난 학문분야의 상호관계성과 연관성에 대한 연구로 연구동향에 대한 시사점을 제시하는 것이다. 학술논문을 이용한 계량적 연구는 주로 논문의 초록, 자동추출 키워드, 논문의 풀텍스트를 활용하는 것이 일반적이나 본 연구는 실험대상 학술논문의 저자가 제시한 주제어에 초점을 두었다. 실험대상 자료는 2009년도 한국연구재단 등재학술지 80종으로 학술논문 7,616건, 주제어 58,143건이다. 자료 분석결과 공학, 농수해양, 복합학, 사회, 예술체육, 의약학, 인문, 자연과학 등의 8개 각 연구분야는 주제어 사용에서 차이점을 보였다. 특히 공학분야의 주제어가 다른 연구 분야에서도 주제어로 많이 사용되고 있었다. 또한 주제어 네트워크를 통해 연구분야를 클러스터링 한 결과, 3개 클러스터를 얻을 수 있었다. 클러스터A는 '공학', '자연과학', '사회', '복합학', '인문', 클러스터B는 '의약학', '예술체육', 클러스터C는 '농수해양'이었다.