• 제목/요약/키워드: text classification

검색결과 730건 처리시간 0.034초

과학기술 논문의 참고문헌 텍스트 정보를 활용한 기술의 군집화 (Technology Clustering Using Textual Information of Reference Titles in Scientific Paper)

  • 박인채;김송희;윤병운
    • 산업경영시스템학회지
    • /
    • 제43권2호
    • /
    • pp.25-32
    • /
    • 2020
  • Data on patent and scientific paper is considered as a useful information source for analyzing technological information and has been widely utilized. Technology big data is analyzed in various ways to identify the latest technological trends and predict future promising technologies. Clustering is one of the ways to discover new features by creating groups from technology big data. Patent includes refined bibliographic information such as patent classification code whereas scientific paper does not have appropriate bibliographic information for clustering. This research proposes a new approach for clustering data of scientific paper by utilizing reference titles in each scientific paper. In this approach, the reference titles are considered as textual information because each reference consists of the title of the paper that represents the core content of the paper. We collected the scientific paper data, extracted the title of the reference, and conducted clustering by measuring the text-based similarity. The results from the proposed approach are compared with the results using existing methodologies that one is the approach utilizing textual information from titles and abstracts and the other one is a citation-based approach. The suggested approach in this paper shows statistically significant difference compared to the existing approaches and it shows better clustering performance. The proposed approach will be considered as a useful method for clustering scientific papers.

태음인체질병증 임상진료지침: 표병 (Clinical Practice Guideline for Taeeumin Disease of Sasang Constitutional Medicine: Esophagus Cold-based Exterior Cold (Wiwansuhan-pyohan) disease)

  • 최애련;신미란;이의주
    • 사상체질의학회지
    • /
    • 제27권1호
    • /
    • pp.42-56
    • /
    • 2015
  • Objectives This research was proposed to present Clinical Practice Guideline(CPG) for Taeeumin Disease of Sasang Constitutional Medicine(SCM): Esophagus Cold-based Exterior Cold (Wiwansuhan-pyohan) disease. This CPG was developed by the national-wide experts committee consisting of SCM professors. Methods First, collection and organization of literature related to SCM such as Donguisusebowon, Text book of SCM, Clinical Guidebook of SCM and Fundamental research to standardize diagnosis of Sasang Constitutional Medicine was performed. Secondly, journals related to clinical trial or Human complementary medicine of SCM were searched. Finally, 7 articles were selected and included in CPG for Esophagus Cold-based Exterior Cold (Wiwansuhan-pyohan) disease. Results & Conclusions The CPG of Esophagus Cold-based Exterior Cold (Wiwansuhan-pyohan) disease in Taeeumin Disease include classification, definition and standard symptoms of each pattern. Esophagus Cold-based Exterior Cold (Wiwansuhan-pyohan) disease consists of two aspects : Esophagus-Cold (Wiwanhan) and Esophagus-Cold Lung-Dry (Wiwanhan-paejo) symptomatology. Esophagus-Cold (Wiwanhan) symptomatology is classified into mild and moderate pattern by severity. Mild pattern of Esophagus-Cold (Wiwanhan) symptomatology is classified into Supraspinal Exterior (Baechu-pyo) initial and Wheezing-Dyspnea (Hyocheon) pattern. Moderate pattern of Esophagus-Cold (Wiwanhan) symptomatology is classified into Cold-reversal (Hanguel) and Cold-reversal (Hanguel) advanced pattern. And Esophagus-Cold Lung-Dry (Wiwanhan-paejo) symptomatology is classified into severe and critical pattern by severity. Severe pattern of Esophagus-Cold Lung-Dry (Wiwanhan-paejo) is classified into Dry-Cold (Johan) pattern and Dry-Cold (Johan) advanced pattern. Critical pattern of Esophagus-Cold Lung-Dry (Wiwanhan-paejo) symptomatology consists of Dry-Cold (Johan) intense pattern (Eumhyeol-mogal handa pattern).

소양인체질병증 임상진료지침: 흉격열병 (Clinical Practice Guideline for Soyangin Disease of Sasang Constitutional Medicine: Chest-Heat congested (Hyunggyeok-yeol) Symptomatology)

  • 박혜선;황민우;이의주
    • 사상체질의학회지
    • /
    • 제26권3호
    • /
    • pp.262-271
    • /
    • 2014
  • Objectives This research was proposed to present Clinical Practice Guideline(CPG) for Soyangin Disease of Sasang Constitutional Medicine (SCM) ; Chest-Heat congested(Hyunggyeok-yeol) Symptomatology. Methods This CPG was developed by the national-wide experts committee consisting of SCM professors. First, collection and organization of literature related to SCM such as Donguisusebowon, Text book of SCM, Clinical Guidebook of SCM and Fundamental research to standardize diagnosis of Sasang Constitutional Medicine was performed. Secondly, journals related to clinical trial or Human complementary medicine of SCM were searched. Finally, 4 articles were selected and included in CPG for Chest-Heat congested(Hyunggyeok-yeol) Symptomatology of Stomach Heat-based Interior Heat disease in Soyangin disease. Results & Conclusions CPG of Chest-Heat congested(Hyunggyeok-yeol) symptomatology in Soyangin disease includes classification, definition and standard symptoms of each pattern. Chest-Heat congested(Hyunggyeok-yeol) symptomatology is classified into mild and moderate pattern by severity. Chest-Heat(Hyunggyeok-yeol) symptomatology Mild pattern is classified into Chest-Heat congested(Hyunggyeok-yeol) initial pattern and Chest-Heat congested(Hyunggyeok-yeol) advanced pattern. And Chest-Heat congested (Hyunggyeok-yeol) moderate pattern is classified into Clear Yang Failure of Stomach(Weguck-cheongyang Bulsagnseung) pattern (Upper wasting-thirst(Sangso) pattern), Clear Yang Failure of Large Intestine (Daejang-cheongyang Bulsangseung) pattern (Middle wasting-thirst (Jungso) pattern).

"의종금감(醫宗金鑑).산보명의방론(刪補名醫方論)"의 보기(補氣) 처방에 대한 연구;번역 및 "고금명의방론(古今名醫方論)"과의 비교고찰을 중심으로 (A Study on The Invigorative Prescriptions(補氣方劑) in "The Elimination & Supplement about The Famous Prescription Comments(刪補名醫方論)" of "The Golden Mirror of Medicine(醫宗金鑑)";focus on translation & comparative study with "The Famous Prescription Comments on Ancient and Modem Times (古今名醫方論)")

  • 김성환;이용범
    • 대한한의학원전학회지
    • /
    • 제20권1호
    • /
    • pp.65-74
    • /
    • 2007
  • "The Golden Mirror of Medicine(醫宗金鑑)" was compiled by the medical officers of the Qing government, headed by Wu-Qian(吳謙)."The Elimination &Supplement about the Famous Prescription Comments(刪補名醫方論)", a collection of notes written by famous scholars, is one part of "The Golden Mirror of Medicine(醫宗金鑑)" . Through the translation and comparative study of invigorative prescription(補氣方劑) in "The Elimination & Supplement about the Famous Prescription Comments(刪補名醫方論)" of "The Golden Mirror of Medicine(醫宗金鑑)" with "The Famous Prescription Comments on Ancient and Modem Times(古今名醫方論)" , we confirmed that many sentences of "The Famous Prescription Comments on Ancient and Modern Times(古今名醫方論)" were quoted, but that most of the text was not quoted as the same: it was revised and supplemented. In organization, invigoration prescriptions are placed at the head of the chapter, indicating their importance. In classification, prescriptions for reinforcing middle-jiao(中焦) and replenishing qi(補中益氣湯類 方劑) were usually included in the invigoration prescriptions(補氣方劑), which is explained in chapter II, thereby clearly distinguishing between treatments of deficiency of qi(氣虛) and combining it with the sinking of qi of middle-jiao(中氣下陷).

  • PDF

트위터 사용자들의 감성을 이용한 사회적 이슈 분석 (Social Issue Analysis Based on Sentiment of Twitter Users)

  • 김한나;정영섭
    • 융합정보논문지
    • /
    • 제9권11호
    • /
    • pp.81-91
    • /
    • 2019
  • 대중들의 소통의 창구로 자리매김 하고 있는 소셜 네트워크 서비스(SNS)에 작성된 글은 감성을 많이 포함하고 있다는 특징을 갖고 있다. 그 중 트위터는 공개 Application Programming Interface(API)를 통한 데이터의 수집이 편리하다는 장점을 지니고 있다. 본 논문에서는 트위터 상에 표현된 사용자들의 감성 정보를 통해 사회적 이슈를 분석하고 마케팅 분야 활용 가능성을 제시한다. 이는 국민 또는 소비자의 의견과 반응을 필요로 하는 정부, 기업 등에 도움이 될 수 있다. 본 논문에서는 최근 사회적 이슈에 대한 트위터 텍스트 데이터를 긍정 또는 부정으로 분류하여 질적 분석을 제공하였고, 각 트윗의 좋아요 수, 리트윗 수 등에 대한 상관관계 분석을 통해 양적분석을 제공하였다. 질적 분석의 결과로 국민의 지지를 얻기 위해 관세정책을 홍보하고, 버즈 사용자에게는 기술적 편의를 제공할 것을 제안하였다. 양적 분석의 결과, 트위터 사용자들의 관심을 끌기 위해서는 긍정적인 트윗을 짧고 간단하게 작성해야 함을 밝혔다. 데이터의 수집 기간이 짧고, 단 두 가지의 키워드만을 분석하여 일반화 가능성이 떨어지는 한계를 가져 향후, 보다 긴 기간의 다양한 사회적 이슈를 분석할 예정이다.

추가 사전학습 기반 지식 전이를 통한 국가 R&D 전문 언어모델 구축 (Building Specialized Language Model for National R&D through Knowledge Transfer Based on Further Pre-training)

  • 유은지;서수민;김남규
    • 지식경영연구
    • /
    • 제22권3호
    • /
    • pp.91-106
    • /
    • 2021
  • 최근 딥러닝 기술이 빠르게 발전함에 따라 국가 R&D 분야의 방대한 텍스트 문서를 다양한 관점에서 분석하기 위한 수요가 급증하고 있다. 특히 대용량의 말뭉치에 대해 사전학습을 수행한 BERT(Bidirectional Encoder Representations from Transformers) 언어모델의 활용에 대한 관심이 높아지고 있다. 하지만 국가 R&D와 같이 고도로 전문화된 분야에서 높은 빈도로 사용되는 전문어는 기본 BERT에서 충분히 학습이 이루어지지 않은 경우가 많으며, 이는 BERT를 통한 전문 분야 문서 이해의 한계로 지적되고 있다. 따라서 본 연구에서는 최근 활발하게 연구되고 있는 추가 사전학습을 활용하여, 기본 BERT에 국가 R&D 분야 지식을 전이한 R&D KoBERT 언어모델을 구축하는 방안을 제시한다. 또한 제안 모델의 성능 평가를 위해 보건의료, 정보통신 분야의 과제 약 116,000건을 대상으로 분류 분석을 수행한 결과, 제안 모델이 순수한 KoBERT 모델에 비해 정확도 측면에서 더 높은 성능을 나타내는 것을 확인하였다.

국내 문학관 웹사이트의 정보 제공 개선 방안 연구 (A Study on Information Services of Korean Literature Houses)

  • 최성연;성희혜;한지윤;이혜은
    • 한국비블리아학회지
    • /
    • 제32권3호
    • /
    • pp.265-284
    • /
    • 2021
  • 본 연구는 국내 문학관 웹사이트의 정보 제공 현황을 파악하여 문학관 온라인 정보서비스의 개선 방안을 제시하는 데 목적이 있다. 연구의 대상은 한국문학관협회 88개 회원관 중 웹사이트가 구축되지 않은 9개관을 제외한 79개관으로 하였다. 문학관의 운영과 문화기관의 온라인 서비스 현황 및 개선 방안에 관련된 선행연구를 참고하여 웹사이트 유형, 문학 정보, 문인 정보 등 3개의 조사 항목과 13개의 세부 조사 항목을 도출하였다. 조사의 결과 국내 문학관의 웹사이트 구축률은 약 90%로 매우 높았으나, 문학 정보의 분류 기준 및 목록정보의 기술이 통일되지 않았고, 문학 자료의 제공이 활성화되지 않은 것으로 나타났다. 이를 개선하기 위한 방안으로 웹사이트 구축 지원, 문학관에 적용 가능한 목록 가이드라인 개발, 원문 제공 활성화, 문학·문인 관련 정보의 제공 등을 제시하였다.

머신러닝을 이용한 의료 및 광고 블로그 분류 (A Classification of Medical and Advertising Blogs Using Machine Learning)

  • 이기성;이종찬
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.730-737
    • /
    • 2018
  • 행복한 삶의 질을 목적으로 하는 의료소비자가 증가하면서 웹에 분산되어 있는 블로그의 의료 정보를 바탕으로 신뢰성 있는 의료 시설을 선택하고 고품질의 의료 서비스를 받음으로서, 시간과 비용을 절약할 수 있는 O2O 의료 마케팅 시장이 활성화 되고 있다. 인터넷, 모바일, SNS 등에서 증가하는 비정형 텍스트 데이터는 전문 의료 지식 이외에 작성자의 관심, 선호, 예상 등을 직간접적으로 반영하고 있기 때문에 의료정보의 신뢰성을 담보하기 어렵다. 본 연구에서는 빅데이터 및 MLP를 사용하여 의료정보 블로그를 분류 (의료블로그, 광고블로그)함으로서 사용자에게 보다 고품질의 의료정보 서비스를 제공하는 블로그 판단 시스템을 제안한다. 제안된 빅데이터 및 머신러닝 기술을 통해 인터넷상에 존재하는 국내의 다수 의료정보 블로그를 종합, 분석한 후 질환별 개인 맞춤형 건강정보 추천 시스템을 개발한다. 이를 통하여 사용자는 자신의 건강문제를 지속적으로 점검하고 가장 적절한 조치를 취함으로서 자신의 건강 상태를 유지하는 것이 가능할 것으로 기대된다.

특허와 뉴스 기사를 이용한 가상현실 기술에 관한 탐색적 연구 (An Exploratory Study of VR Technology using Patents and News Articles)

  • 김성범
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.185-199
    • /
    • 2018
  • 이 연구의 목적은 가상현실(VR)의 핵심기술을 특허 분석을 통해서 도출하고 VR에 대한 사회와 대중의 관심을 뉴스 분석을 통해서 탐색하는 것이다. 연구1에서는 특허 텍스트의 단어 출현 빈도를 이용하여 핵심 키워드를 도출하고 업체별, 연도별, 기술 분류별 비교를 하였으며, 네트워크 분석 프로그램인 넷마이너를 사용하여 특허의 IPC 코드를 분석하였다. 연구2에서는 뉴스 기사의 텍스트를 내용분석 도구인 T-LAB 프로그램을 사용하여 분석하였다. 키워드 선정을 위해 TF-IDF를 사용하였고, 카이제곱과 연관지수(Association index) 알고리즘을 사용하여 VR과 관련성이 높은 단어를 추출하였다. 이 연구를 통해 VR 기술이 광학과 머리착용디스플레이(HMD), 데이터 분석, 전기, 전자 기술을 포함하는 융합기술임을 확인하였고, 광학기술이 중심적 기술임을 발견하였다. 뉴스 기사를 통해서는 대중은 VR 공급업체와 시장의 형성과 성장에 관심을 가지며 VR은 사용자 경험에 기초해서 개발되어야 함을 도출하였다.

대화시스템 미지원 도메인 검출에 관한 조사 (Survey on Out-Of-Domain Detection for Dialog Systems)

  • 정영섭;김영민
    • 융합정보논문지
    • /
    • 제9권9호
    • /
    • pp.1-12
    • /
    • 2019
  • 대화시스템은 인간과 컴퓨터 사이의 새로운 의사소통 수단으로 떠오르고 있다. 대화시스템은 인간의 음성을 입력으로 취하여, 적절한 음성 답변 또는 서비스를 제공하게 된다. 아마존 에코, 네이버 웨이브 등과 같은 대화시스템 제품들이 등장하고 있음에도 불구하고, 이 대화시스템들은 공통적으로 미지원 도메인을 제대로 처리하지 못한다는 문제점을 안고 있다. 이와 관련한 몇몇 연구들이 있었지만, 이 문제를 풀기 위한 더욱 많은 연구가 진행될 필요가 있다. 이 논문에서는, 미지원 도메인 검출과 관련한 기존 연구들에 대하여 3가지 관점, 즉 데이터, 자질, 방법에 대한 관점으로 요약한 정보를 제공한다. 데이터셋이 부족하다는 점으로 인해 타 연구분야에 비해 적은 연구가 수행되어왔으므로, 앞으로 가장 시급한 연구 주제는 대화시스템의 미지원 도메인 검출을 위한 공개용 데이터셋을 구축하고 배포하는 것이다.