• 제목/요약/키워드: 핵심어 분석

검색결과 225건 처리시간 0.023초

Bidirectional Dynamic LSTM 을 이용한 음절 단위 개체명 추출 및 자동화된 말뭉치 구축 (Syllables-based Named Entity Extraction and Automatic Corpus Construction using Bidirectional Dynamic LST)

  • 오성식;임창대;안기호;박외진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.317-320
    • /
    • 2017
  • 개체명 인식은 자연어 문장에서 장소, 제작물, 사람 등 분류를 통한 의미 부여가 가능한 단어를 파악하는 기술로서 의미 분석을 위한 핵심 기술이다. 현재 많은 개체명 분석 관련 연구들은 형태소 분석 결과에 의존적인 형태를 갖고 있어서, 형태소 분석 결과의 정확성이 개체명 분석 결과의 성능에 영향을 미치고 있다. 본 연구에서는 형태소 분석 과정을 거치지 않는 음절 기반의 개체명 분석 기술을 제안하여 형태소 분석의 정확도가 낮은 통신어, 신조어 분석 성능을 향상하였다. 또한, 자동화된 방법으로 음절 단위 개체명 말뭉치 및 개체명 사전을 구축하는 프로세스를 정의하여 개체명 분석의 정확도 향상 및 인지 범주의 확대를 도모하였다. 본 연구에서 제안한 개체명 인식 기술은 한국어 개체명 표준에 기반한 129가지의 개체명 분류가 가능하며, 이는 자연어 처리 기술이 필요한 산업계에서 상용화하는데 큰 기여를 할 것으로 판단된다.

  • PDF

풍부한 메타데이터를 가진 동영상 추천 시스템의 성능 평가 (Performance Evaluation of Video Recommendation System with Rich Metadata)

  • 조민화;김다연;이화랑;오하늘;이선영;정인환;이재문;황기태
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권2호
    • /
    • pp.29-35
    • /
    • 2023
  • 본 논문은 영상으로부터 풍부한 메타데이터를 자동으로 생성하고 키워드로 동영상을 검색하는 선행 연구를 개선하여 문장 단위로 동영상을 검색할 수 있게 하였다. 문장 단위의 검색을 위해, 검색 문장에 대해 형태소를 분석하여 문장에서 핵심어를 추출하고, 각 핵심어에 가중치를 부여한 다음, 선행 연구에서 작성된 랭킹 알고리즘을 적용하여 동영상들을 추천한다. 본 논문의 동영상 검색 성능을 평가하기 위해서는 충분한 양의 동영상과 충분한 수의 사용자 경험이 필요하다. 하지만 이것이 부족한 현 상황에서 검색 결과에 대한 사용자의 전반적인 만족도, 추천 점수와 사용자 만족도의 비교 평가, 동영상 카테고리별 사용자 만족도 등을 평가하는 간접적인 방법을 사용하였다. 성능 평가 결과, 본 논문에서 구현한 풍부한 메타데이터 구축 및 동영상 추천 시스템은 사용자에게 높은 검색 만족도를 주는 것을 나타났다.

지식기반 (Knowledge-based) 질의응답시스템: 사실 자료 (Faet Database)구축을 중심으로 (A Knowledge-based Question-Answering System: With A View To Constructing A Fact Database)

  • 신효필
    • 인지과학
    • /
    • 제13권1호
    • /
    • pp.41-51
    • /
    • 2002
  • 본 논문에서는 질의어 응답시스템에 있어 핵심이 되는 사실 자료 (Fact Database) 구축의 관점에서 지식기반 방법의 중요성과 그 과정에 대해서 논의한다. 지식기반 질의어 시스템은 기존의 이용가능한 자연언어처리의 자원-형태소, 구문, 의미분석 등-과 온톨로지라는 개념구조망을 이용하는 시스템으로 이 개념을 현실세계의 사실 자료와 연결시켜 개념구조가 지닌 속성과 값의 확장을 통해 그 가능한 응답을 유도해 내는 시스템이다. 이 시스템 구축에 있어 실제 세계의 자료를 수집하고 가공하고 개념화하는 과정은 이 시스템의 성패를 좌우하는 핵심작업으로 아직은 완전히 자동화되기 어렵다. 그러나 지식기반에 기초한 방법은 응용시스템의 질적 향상이라는 측면에서 진지하게 논의될 필요가 있다. 이 글에서는 사실 자료 구축의 관점에서 이런 작업들이 어떻게 행해져야 하는지 그리고 그 방법론이 지닌 특징 및 문제점에 대해 논의한다.

  • PDF

한국어 자소 음가 분류에 관한 연구 (A Study on the Korean Grapheme Phonetic Value Classification)

  • 유승덕;김학진;김순협
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.89-92
    • /
    • 2001
  • 본 논문에서는 한국어 대용량 음성인식 시스템의 기초가 되는 자소(grapheme)가 지니는 음가를 분류하였다. 한국어 자소를 음성-음운학적으로 조음 위치와 방법에 따라 분류하여, 그 음가 분석에 관한 연구와 함께 한국어 음성인식에서 앞으로 많이 논의될 청음음성학(auditory phonetics)에 대하여 연구하였다. 한국어는 발음상의 구조와 특성에 따라 음소 분리가 가능하여 초성, 중성, 종성 자소로 나눌 수 있다. 본 논문에서 초성은 자음음소 18개, 중성은 모음 음소(단모음, 이중모음) 17개, 그리고 'ㅅ' 추가 8종성체계의 자음음소로 하였다. 청음음성학적 PLU(Phoneme Like Unit)의 구분 근거는 우리가 맞춤법 표기에서 주로 많이 틀리는 자소(특히, 모음)는 그 음가가 유사한 것으로 판단을 하였으며, 그 유사음소를 기반으로 작성한 PLU는 자음에 'ㅅ' 종성을 추가하였고, 모음에 (ㅔ, ㅐ)를 하나로, (ㅒ, ㅖ)를 하나로, 그리고 모음(ㅚ, ㅙ, ㅞ)를 하나의 자소로 분류하였다. 혀의 위치와 조음 방법과 위치에 따라 분류한 자음과 모음의 자소를 HTK를 이용하여 HMM(Hidden Markov Model)의 자소 Clustering하여 그것의 음가를 찾는 결정트리를 검색하여 고립어인식과 핵심어 검출 시스템에 적용 실험한 결과 시스템의 성능이 향상되었다.

  • PDF

텍스트마이닝을 활용한 국외 노인작업치료의 연구동향 분석 (Study on the Research Trend of Overseas Elderly Occupational Therapy Using Text Mining)

  • 김아람;이태권;정인재;박혜연
    • 재활치료과학
    • /
    • 제10권1호
    • /
    • pp.7-17
    • /
    • 2021
  • 목적 : 본 연구는 텍스트마이닝을 활용하여 국외 노인 작업치료의 양적 변화와 현황 파악을 정량적으로 분석하고자 하였다. 연구 방법 : 2009~2019년까지 PubMed를 활용하여 Elderly, Health, Occupational therapy가 들어간 제목과 초록이 존재하는 연구논문을 분석대상으로 선정하여 초록의 단어들을 수집하였다. 수집된 정보를 통해 연도별 발생 논문 편수, 핵심어 분석, 연도별 핵심어 분석, 단어들 간의 관계성을 분석하였다. 결과 : 2009-2019년에 발표된 논문은 9,941편이며, 2009년부터 점차적으로 증가하여 2017년 또는 2018년에 최다 빈도를 보인 후 2019년에 감소하는 추이를 보였다. 최근 5년간 빈도수가 많은 단어는 Care, Group, Intervention, Pain, Treatment, Work이었다. 최근 11년간 평균적인 빈도수를 기준으로 단어 간의 관계성을 파악한 결과, Function, Health, Intervention, Participation이 단어들 간의 높은 관계성을 보였다. 결론 : 본 연구는 텍스트마이닝이라는 새로운 연구방법을 적용하여 작업치료의 동향을 실증적, 체계적으로 분석하여 거시적이고 종합적인 결과를 제시했다는 점에 의의가 있다. 이를 토대로 노인과 관련된 작업치료 임상 및 연구 현장에서 새로운 연구방향을 설정하는데 도움이 될 것으로 기대한다.

사회과학 분야 사회적 체계 이론 연구의 지식 시각화와 매핑 - Niklas Luhmann을 중심으로 - (Knowledge Visualization and Mapping of Studies on Social Systems Theory in Social Sciences: Focused on Niklas Luhmann)

  • 박성우;홍소람
    • 한국문헌정보학회지
    • /
    • 제56권1호
    • /
    • pp.253-275
    • /
    • 2022
  • Niklas Luhmann은 사회학 이론가들 중 가장 논쟁적이고 난해한 학자이면서 동시에 근 10년간 후속연구가 증가하고 있는 학자이다. 이 연구의 목적은 Luhmann의 후속연구들이 Luhmann의 난해한 개념을 어떻게 사용하고 있는지를 관찰하는 것이다. 이 연구는 선행연구와 달리 분석의 단위를 논문이 아니라 키워드로 채택하였다. 키워드는 개념을 관찰 가능하게 만드는 언어적 구성물이기 때문이다. Web of Science의 검색결과 나온 139편의 사회과학 분야 논문의 키워드를 동시출현빈도 분석하였다. 연구 결과는 다음과 같다. 첫째, 가장 중요한 키워드가 Luhmann의 이름과 이론의 이름이었다. 둘째, 클러스터링은 사회적 체계 이론, 일반체계이론, 법 체계와 정치체계, Luhmann 이론의 사회이론적 의의 등 4가지로 묶였다. 셋째, 핵심어가 'systems theory(일반체계이론)', 'communication(소통)', 'Autopoiesis(자기생산)', 'risk(위험)', 'legal system(법 체계)', 'functional differentiation(기능적 분화)', 'environment(환경)', 'social theory(사회적 이론)', 'sociological theory(사회학적 이론)', 'structural coupling(구조적 연결)', 'systems(체계들)', 'evolution(진화)'로 도출되었다. 이 연구의 의의는 다음과 같다. 첫째, 핵심어를 도출해내 Luhmann의 이론을 처음 접근하는 사람들에게 유용한 접근점을 제공하였다. 둘째, 난해한 이론적 연구의 동향 분석에도 키워드 네트워크를 통한 내용분석이 가능함을 증명하였다.

게임 인공지능 초기이용자 만족에 미치는 요인 분석 - 엔씨소프트의 블레이드앤소울 AI 조기수용자를 중심으로 - (The Study of Users' Satisfaction on Game AI - Focused on Blade&Soul AI by NCSoft -)

  • 여향란;위정현
    • 한국게임학회 논문지
    • /
    • 제20권3호
    • /
    • pp.3-14
    • /
    • 2020
  • 본 연구의 목적은 게임 인공지능의 조기정착과 확산을 위해 이용자 만족에 영향을 미치는 요인을 분석하는 것이다. 이를 위해 엔씨소프트의 MMORPG 게임 '블레이드&소울'을 플레이한 경험이 있는 20명의 이용자를 대상으로 심층 인터뷰를 진행하였다. 인터뷰 자료는 언어네트워크 분석 프로그램을 통해 핵심주제어를 파악, 주제어 사이의 관계를 분석하였다. 분석 결과 인공지능 게임 이용자 만족도에 영향을 미치는 키워드로 패턴, 콘텐츠, 다양성, 시스템, 신규유저확보 등이 도출되었다.

은닉형 Vault 안티포렌식 앱 탐색을 위한 XML 기반 특징점 추출 방법론 연구 (A Study on the Feature Point Extraction Methodology based on XML for Searching Hidden Vault Anti-Forensics Apps)

  • 김대규;김창수
    • 인터넷정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.61-70
    • /
    • 2022
  • 스마트폰 앱을 사용하는 일반 사용자들은 개인이 소유하고 있는 사진, 동영상 등 개인정보를 보호하기 위해 Vault 앱을 많이 사용하고 있다. 그러나 범죄자들은 불법 영상들을 은닉하기 위해 Vault 앱 기능을 안티포렌식 용도로 악용하는 사례가 증가하고 있다. 이러한 앱들은 구글 플레이에 정상적으로 등록된 매우 많은 앱들 중 하나이다. 본 연구는 범죄자들이 이용하고 있는 Vault 앱들을 탐색하기 위해 XML 기반의 핵심어 빈도 분석을 통해 특징점을 추출하는 방법론을 제안하며, 특징점 추출을 위해서는 텍스트마이닝 기법을 적용한다. 본 연구에서는 은닉형 Vault 안티포렌식 앱과 비은닉형 Vault 앱 각각 15개를 대상으로 앱에 포함된 strings.xml 파일을 활용하여 XML 구문을 비교 분석하였다. 은닉형 Vault 안티포렌식 앱에서는 불용어처리를 1차, 2차 거듭할수록 더 많은 은닉 관련 단어가 높은 빈도로 발견된다. 본 연구는 공학 기술적인 관점에서 APK 파일을 정적 분석하는 대부분의 기존 방식과는 다르게 인문사회학적인 관점에서 접근하여 안티포렌식 앱을 분류해내는 특징점을 찾아내었다는 것에 의의가 있다. 결론적으로 XML 구문 분석을 통해 텍스트마이닝 기법을 적용하면 은닉형 Vault 안티포렌식 앱을 탐색하기 위한 기초 자료로 활용할 수 있다.

빅데이터를 활용한 뉴노멀(New normal)시대의 관광행태 변화에 관한 연구 (A Study on Tourism Behavior in the New normal Era Using Big Data)

  • 유경미;강종천;최연희
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.167-181
    • /
    • 2023
  • 본 연구는 코로나 19 발생 후 여행 제재가 완화된 현재의 관광행태 변화를 분석하기 위해 소셜네트워크 분석프로그램인 TEXTOM을 활용하였다. 네이버, 구글, 다음이 제공하는 블로그, 카페, 뉴스 등을 대상으로 '국내여행', '해외여행' 키워드에 대한 데이터를 수집하였다. 사회적 거리두기가 해제된 2022년 4월~12월로 수집 기간을 정하였고, 코로나19 발생 이전인 2019년과 코로나19의 영향이 가장 심각했던 2020년은 각각 1년으로 하여 2022년과 비교 분석하였다. 텍스트 마이닝을 통하여 각각 총 80개의 핵심어를 추출하고 NetDraw를 사용하여 중심성분석을 하였다. 마지막으로 CONCOR분석을 통하여 상관관계가 있는 핵심어들을 4개로 군집화하였다. 연구결과, 2022년도의 관광행태는 코로나 발생 이전으로의 관광 회복, 각자가 선호하는 테마를 중심으로 여행의 세분화, 나라별 코로나 완화정책을 우선적으로 검색해 본 후 관광지를 선택하는 관광행태를 보인다. 코로나19 이후에 새롭게 도래하는 관광생태계에 대한 관광마케팅 전략과 관광상품 개발을 위한 기초자료를 제공할 것으로 기대한다.

의료서비스 디자인싱킹 교육의 공감적 문제해결능력 향상 효과: 정형 및 비정형 데이터 융복합 분석 중심으로 (The Effect of Medical Service Design Thinking Teaching-learning on Empathic Problem Solving Ability: Convergence Analysis of Structured and Unstructured Data)

  • 유진영
    • 디지털융복합연구
    • /
    • 제18권6호
    • /
    • pp.311-321
    • /
    • 2020
  • 저학년 예비보건행정가의 SNS 병원마케팅 교육에 의료서비스 디자인싱킹 교수법을 적용하고 공감적 문제해결능력 향상 효과를 확인하고자 한다. 대구광역시 일개 대학 보건행정과 1학년 학생 39명을 대상으로 2019년 9월부터 12월까지 총 15주간 의료서비스 디자인싱킹을 적용한 후 사전-사후 자기기입식 설문조사를 실시하였다. 저학년 예비보건행정가들의 공감적 문제해결능력 향상 효과는 공감적 상상하기, 공감적 관심, 공감적 각성하기에 긍정적 효과가 있었다. 핵심공통어 분석은 중립어와 부정어 사용은 낮지만 긍정어 사용은 높았다. 인공지능 시대에 공감적 문제해결 직무역량을 체계적으로 갖출 수 있도록, 저학년 교과교육을 위한 프로그램을 개발하고 그 효과성을 정형 및 비정형 데이터 분석을 한 점이 의의가 있다. 이론 교과 적용을 위한 추가 프로그램 개발 연구가 필요하다.