• 제목/요약/키워드: 키워드 탐색

검색결과 247건 처리시간 0.035초

영미 아동 모험 소설에 관한 코퍼스 분석 연구: 『보물섬』을 중심으로 (A Corpus Analysis of British-American Children's Adventure Novels: Treasure Island)

  • 최은샘;정채관
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.333-342
    • /
    • 2021
  • 본 연구에서는 대표적인 영미 아동 모험 소설 『보물섬』의 언어적 특징을 파악하기 위해 『보물섬』을 코퍼스화 하여 어휘, 리마, 키워드, n-그램을 분석하였다. 이 연구를 통해 고빈도 어휘가 텍스트의 핵심어라는 일반적인 주장과 달리 『보물섬』의 고빈도 어휘는 『보물섬』과 직접 관련이 없는 기능어, 고유명사 등이 최상위층에 포진하고 있다는 것을 발견하였고, 통계적인 방법으로 추출한 『보물섬』 키워드 역시 『보물섬』의 내용을 가늠하기에 충분하지 않음을 발견하였다. 따라서 1차 정량적인 키워드 분석 후 진행된 2차 정성적인 키워드 분석을 통해 추출한 30개의 핵심 키워드를 통해 『보물섬』 내용을 신속하고 구체적으로 파악하는 단초를 마련하였고, 이를 바탕으로 그동안 직관적으로만 회자 되던 『보물섬』에 나타난 남성성을 계량적으로 분석할 수 있었다. 또한, n-그램 분석을 통해 『보물섬』의 작가가 다른 작가에 비해 선호하고 자주 사용하는 연속어휘구를 발견하였고, 이를 토대로 문학 작품의 계량적 연구가 가능한 코퍼스 문체론 연구의 가능성을 탐색하였다. 본 연구를 통해 밝혀낸 연구결과가 영미 아동문학 콘텐츠의 확산과 코퍼스 문체론 연구에 도움이 되기를 희망한다.

공간통계분석기법을 이용한 소셜 네트워크 유력지역 탐색기법 연구 (A Study on Detection Methodology for Influential Areas in Social Network using Spatial Statistical Analysis Methods)

  • 이영민;박우진;유기윤
    • 대한공간정보학회지
    • /
    • 제22권4호
    • /
    • pp.21-30
    • /
    • 2014
  • 최근 소셜 미디어의 활성화로 인해 소셜 네트워크상에서 수많은 자발적 추종자들을 확보한 새로운 형태의 유력자가 대두되고 있다. 소셜 네트워크상에서의 유력자를 탐색하는 연구들이 진행되어 왔고, 관련 서비스가 제공 중에 있으나 이들은 유력자 규명에 있어 위치기반 소셜 네트워크 서비스(LBSNS)가 가지고 있는 위치 정보에 대한 반영이 부족하다는 한계점을 가지고 있었다. 이에 본 연구에서는 공간통계분석기법을 이용하여 LBSNS 데이터를 대상으로 다양한 사회문화적 이슈에 대한 발언에 영향력을 가지는 유력자를 공간적으로 탐색하고, 이를 활용하는 방안을 제시하고자 하였다. 이를 위해 트위터의 지오태깅된 메시지를 분석 데이터로 사용하였으며, 서울시를 공간적 범위로 하여 한 달 동안 총 168,040건의 메시지를 수집하였다. 또한 '정치', '경제', 'IT'를 연구 대상 범주로 설정하고, 데이터 수집 기간 동안 이슈가 되었던 키워드들을 주어진 범주별로 분류하였다. 이를 바탕으로 키워드에 대한 유력자를 파악하기 위한 노출도를 도출하고, 이에 대해 서울시의 행정동을 기준으로 공간결합연산을 실시함으로써 각 키워드에 대한 행정동별 노출도를 산출하였다. 그리고 행정동별로 산출된 노출도의 공간적 의존성을 고려하여 유력지수를 도출하였으며, 키워드별로 상위의 유력지수를 보이는 지역을 유력지역으로 추출하여 이들의 공간적인 분포 특성과 키워드들 간의 공간적 상관성을 분석하였다. 실험 결과, 동일 범주 내에서 키워드 간의 공간적 상관계수는 0.3 이상으로 높은 상관성을 보였으며, 정치범주와 경제범주의 키워드 간 상관계수 역시 평균 0.3으로 비교적 높은 상관성을 보인 반면, 정치범주와 IT범주, 경제범주와 IT범주 키워드 간의 상관계수는 각각 0.18, 0.15로 낮은 상관성을 보였다. 본 연구는 유력자에 대한 연구를 공간 정보의 관점에서 구체화시켰다는 점에서 의의를 가지며, 향후에 gCRM(geographic Customer Relationship Management) 등의 분야에 유용하게 활용될 수 있을 것이다.

언택트 연구의 지식구조에 대한 탐색적 분석 (A Exploratory Analysis on Knowledge Structure of Untact Research)

  • 김성묵;차현희
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.367-375
    • /
    • 2021
  • 본 연구는 텍스트 마이닝을 이용하여 언택트 연구의 지식구조를 파악하고 연구 방향 정립을 위한 함의를 찾고자 하였다. 2019년부터 2020년 10월까지 발표된 연구 문헌 171편의 서지정보를 네트워크 분석과 토픽 모델링 기법을 사용, 분석하였다. 사용, 서비스, 소비, 영향, 기술 키워드 등의 등장 빈도가 높았고, 등장논문의 수는 코로나19, 기술, 사용, 서비스의 순서였다. 중심성과 구조적 공백 분석 결과 서비스, 사용, 소비, 기술, 온라인 등의 키워드를 중심으로 연구가 이루어졌고, 더 연구가 필요함을 확인하였다. 토픽 모델링으로 코로나19와 사회기술변화, 교육콘텐츠 필요성 및 활용, 사용자 편의 기술 및 서비스, 제품 마케팅 및 판매, 기업의 서비스 디자인, 사용과 소비 영향요인 등 6개 토픽을 추출하였고 토픽을 잇는 키워드는 기술, 서비스, 사용, 소비, 필요, 요인 등이었다. 지식구조 분석은 언택트 연구와 정책 제안에 유용한 정보를 제공할 수 있다. 본 연구의 탐색적 성격을 넘어 양적 축적과 질적 다변화가 필요하다.

매쉬업을 위한 Open API 유사성 탐색 방법 (Open API Similarity Searcing Method for Mashups)

  • 이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1279-1282
    • /
    • 2012
  • 매쉬업은 공개된 Open API들을 이용하여 두 가지 이상의 서로 다른 자원을 섞어서 완전히 새로운 가치의 서비스를 만드는 것이다. 그렇지만, Open API 포털 사이트들은 매쉬업에서 사용 가능한 수많은 API들을 제공하고 있는데 이들에 대한 조합 가능한 API 들을 탐색하고 발견하는 것은 매우 힘들고 많은 시간이 소비되는 작업이다. 본 논문에서는 다양한 Open API 타입들에 대한 API 유사성 탐색 방법을 지원하기 위해 계층적 결합 클러스터링 알고리즘과 계층관계 형태소 분석 기법을 제안한다. 본 논문에서 제안된 방법은 programmableWeb과 xmethods.net 사이트로부터 168개의 REST API와 50개의 SOAP API를 다운로드 받아 실험 분석을 수행하였으며 우리의 접근방법이 기존의 키워드 검색 방법과 Woogle 방법 보다 성능이 우수함을 보인다.

한국학 연구 논문의 의미 구조 기반 메타데이터 연구 (A Study on the Metadata based on the Semantic Structure of the Korean Studies Research Articles)

  • 송민선;고영만
    • 한국도서관정보학회지
    • /
    • 제46권3호
    • /
    • pp.277-299
    • /
    • 2015
  • 본 연구의 목적은 복합학의 특성을 띠는 한국학 분야 연구 논문을 대상으로 의미적 탐색 시스템 구축을 위한 메타데이터를 체계적으로 구조화하기 위한 것이다. 이를 위해 먼저 학술 자료의 내용적 의미 구조를 정리한 기존의 연구들을 비교 분석하고, 이어서 한국학 분야 연구 논문에 수록된 저자키워드의 유형별 범주화 작업을 통해 한국학 분야에서 필요로 하는 연구 논문의 의미적인 구조를 분석하였으며, 두 작업의 결과를 기반으로 한국학 분야 연구 논문의 의미적 탐색 시스템을 구축하기 위한 의미구조 메타데이터 항목 16개를 도출하여 체계화 하였다. 본 연구는 실제 한국학 분야 연구자들이 필요로 하는 학술적 지식을 반영할 수 있는 의미적 메타데이터 구성 방법론을 체계적으로 제시하였으며, 특히 한국학 분야 연구 자료의 내용적 특성을 살펴보는데 있어 실제 연구자들이 부여한 키워드를 유형화하고 분석하여 반영하였다는데 의의가 있다.

시민 정보요구 범주화 연구 (A Study on the Categorization of Citizens' Information Needs)

  • 이지영;김기영;박영숙
    • 한국문헌정보학회지
    • /
    • 제50권2호
    • /
    • pp.245-269
    • /
    • 2016
  • 본 연구는 시민들이 일상생활에서 마주하는 문제들을 그 탐색행위의 특성에 기반하여 범주화함으로써 시민들의 정보문제 해결에 실질적인 도움이 되는 정보 서비스를 탐색하기 위하여 실시되었다. 우선, 심층면담을 통해 시민들이 일상생활에서 직면한 문제에 대한 핵심 키워드를 추출하였다. 추출된 키워드는 정보탐색행위의 특성에 따라 6가지 문제 영역(취미, 법률, 시사, 교육, 건강, 경제)으로 범주화하였으며, 범주화 결과의 타당성을 위해 설문을 통해 각 범주의 선호 정보원의 차이에 대하여 통계 분석을 실시하였다. 그 결과, 문제 영역 간에 선호 정보원의 차이가 검증되었으며, 이를 통해 취미, 법률, 시사, 교육, 건강, 경제로 구분한 6가지 문제 영역 구분이 어느 정도 타당성을 가지고 있는 것으로 나타났다. 본 연구는 이러한 결과를 기반으로 기존의 주제별 정보 서비스에 대한 재검토 필요성을 제기하며, 문제 중심 정보 서비스로의 전환 가능성을 논의하였다.

Web of Science 빅데이터를 활용한 텍스트 마이닝 기반의 정보윤리 이슈 탐색 (Exploring Information Ethics Issues based on Text Mining using Big Data from Web of Science)

  • 김한성
    • 컴퓨터교육학회논문지
    • /
    • 제22권3호
    • /
    • pp.67-78
    • /
    • 2019
  • 본 연구의 목적은 Web of Science(WoS)에서 제공하는 학술 빅데이터를 활용하여 정보윤리 이슈를 탐색하고 향후 정보과 정보윤리 교육을 위한 시사점을 제공하는 것에 있다. 이를 위해 WoS에서 제공하는 학술논문 중 정보윤리와 관련해 출판된 318편의 논문을 텍스트 마이닝 하였다. 구체적으로는 R을 활용해 주요키워드에 대한 빈도 분석(TF, DF, TF-IDF), 토픽 모델링 기반의 정보윤리 이슈 분석, 그리고 각 이슈에 대한 연도별 출연 빈도를 분석하여 정보윤리 연구의 경향성을 탐색하였다. 주요 결과를 살펴보면 다음과 같다. 첫째, TF-IDF를 통해 'digital', 'student', 'software', 'privacy' 등의 단어가 주요 키워드임을 확인하였다. 둘째, 토픽 모델링 분석 결과, 'Professional value', 'Cyber-bullying', 'AI and Social Impact' 등을 포함한 총 8개 이슈로 분석되었고, 그 중, 'Professional value'와 'Cyber-bullying' 이슈가 상대적으로 높은 비율을 차지하고 있었다. 본 연구는 이러한 분석 결과를 기초로 우리나라 정보윤리 교육을 시사점을 논의하였다.

키워드 네트워크 분석을 활용한 기후변화 교육 관련 연구동향 분석 (Keyword Network Analysis of Trends in Research on Climate Change Education)

  • 김순식;이상균
    • 대한지구과학교육학회지
    • /
    • 제13권3호
    • /
    • pp.226-237
    • /
    • 2020
  • 본 연구의 목적은 연구제목에서 추출한 키워드를 중심으로 네트워크 분석을 활용하여 기후변화 교육 관련 연구동향을 분석하는 것이다. 이를 위하여 2015년부터 2020년 11월까지 한국연구재단(KCI) 등재(후보)지에 게재된 기후변화 교육 관련 논문의 연도별, 학습지별 동향을 파악하고, 논문에 제시된 키워드에 대한 네트워크 분석을 실시하였다. 분석절차는 분석 대상 선정, 키워드 추출과 정제, 키워드 네트워크 분석 및 시각화의 과정으로 진행되었다. 자료처리는 Textom 분석 프로그램, Ucinet 6.0, NetDraw 프로그램을 활용하였다. 연구결과는 다음과 같다. 첫째, 2011년부터 2020년 사이 총 62편의 기후변화 교육 관련 논문이 게재되었으며, 학술지는 '에너지기후변화 교육'에서 가장 많은 기후변화 교육 관련 논문이 게재된 것으로 나타났다. 둘째, 키워드 '프로그램' 키워드가 가장 높은 빈도를 보였으며, 그 다음으로 '에너지', '분석', '초등학교', '초등학생', '개발', '영향' 등이 높은 빈도를 보였다. 셋째, 연결정도 중심성 분석결과 '프로그램', '초등학생', '초등학교' 지수가 가장 높게 나타났으며, 가장 큰 군집은 '교수·학습 프로그램 개발과 효과'가 형성되었다. 본 연구는 전반적인 기후변화 교육 관련 연구동향을 탐색하고, 향후 연구주제에 대한 방향성을 파악하였다는 데 의의가 있다.

키워드 출현 빈도 분석과 CONCOR 기법을 이용한 ICT 교육 동향 분석 (Analysis of ICT Education Trends using Keyword Occurrence Frequency Analysis and CONCOR Technique)

  • 이영석
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.187-192
    • /
    • 2023
  • 본 연구는 기계학습의 키워드 출현 빈도 분석과 CONCOR(CONvergence of iteration CORrealtion) 기법을 통한 ICT 교육에 대한 흐름을 탐색한다. 2018년부터 현재까지의 등재지 이상의 논문을 'ICT 교육'의 키워드로 구글 스칼라에서 304개 검색하였고, 체계적 문헌 리뷰 절차에 따라 ICT 교육과 관련이 높은 60편의 논문을 선정하면서, 논문의 제목과 요약을 중심으로 키워드를 추출하였다. 단어 빈도 및 지표 데이터는 자연어 처리의 TF-IDF를 통한 빈도 분석, 동시 출현 빈도의 단어를 분석하여 출현 빈도가 높은 49개의 중심어를 추출하였다. 관계의 정도는 단어 간의 연결 구조와 연결 정도 중심성을 분석하여 검증하였고, CONCOR 분석을 통해 유사성을 가진 단어들로 구성된 군집을 도출하였다. 분석 결과 첫째, '교육', '연구', '결과', '활용', '분석'이 주요 키워드로 분석되었다. 둘째, 교육을 키워드로 N-GRAM 네트워크 그래프를 진행한 결과 '교육과정', '활용'이 가장 높은 단어의 관계로 나타났다. 셋째, 교육을 키워드로 군집분석을 한 결과, '교육과정', '프로그래밍', '학생', '향상', '정보'의 5개 군이 형성되었다. 이러한 연구 결과를 바탕으로 ICT 교육 동향의 분석 및 트렌드 파악을 토대로 ICT 교육에 필요한 실질적인 연구를 수행할 수 있을 것이다.