• Title/Summary/Keyword: 텍스트 연구

Search Result 3,492, Processing Time 0.036 seconds

A Study on the semantic information analysis and classification for SNS image (SNS 이미지 의미정보 분석 및 분류에 관한 연구)

  • Lee, Seongjae;Cho, Sungwoo;Cho, Soosun
    • Annual Conference of KIPS
    • /
    • 2012.11a
    • /
    • pp.507-509
    • /
    • 2012
  • 많은 사용자가 직접 글을 작성하고 데이터를 업로드 하는 SNS 서비스의 데이터 분류 및 분석에서 빅 데이터 활용방안이 다양하게 논의되고 있다. 특히 기존에 활용하던 텍스트 기반의 분류에서 이미지, 동영상에 대한 분류가 다양하게 시도되고 있다. 본 논문에서는 위키피디아를 이용한 이미지 태그의 의미정보를 바탕으로 플리커에서 샘플 이미지를 추출하고 이를 활용하여 'bag of visual word' 기법으로 사용자가 업로드한 이미지를 자동 분류하는 방법을 소개한다.

Transcriptome visualization framework development (전사체 시각화 프레임워크 개발)

  • Hwang, HyeRyeon;Kim, Sora;Cho, Hwan-Gue
    • Annual Conference of KIPS
    • /
    • 2012.11a
    • /
    • pp.1340-1343
    • /
    • 2012
  • 정보의 시각화는 추상적 정보를 직관적으로 이해하기 쉽도록 시각적으로 명확하게 표현하는 방법을 말한다. 대용량의 바이오 데이터를 다루는 생물정보학(bioinformatics) 분야에서는 컴퓨터의 높은 성능을 활용하여 수많은 유전학적 데이터들을 분석하고 있다. 다양한 생물정보학 실험에서 전사체는 특정한 조건에서 발현된 RNA의 총합을 말한다. 분석된 전사체 정보는 텍스트형태로 제공이 되는데 이를 사용자가 수작업으로 비교하는 데에는 한계가 있다. 따라서 분석된 전사체 정보를 효과적으로 인지할 수 있도록 시각화하는 연구들이 진행되고 있다. 본 논문에서는 그래프 라이브러리인 yFile을 활용하여 추정된 전사체를 실시간으로 시각화하여 제공하는 방법을 제안한다. GTF파일을 입력받아서 데이터베이스에 저장하고 이 정보를 이용하여 그래프를 생성한다. 실험 결과는 전사체를 시각화 하는 방법을 통하여 다양한 전사체 정보를 알아 낼 수 있고, 최종적으로는 novel gene을 찾는 것이 가능할 것으로 기대한다.

A Study on the Product Factor Verification and Process Management and Safety Using the Text mining (텍스트 마이닝 기법을 통한 제품 인자 검증 및 안전 관리 연구)

  • Jung, Chule-kyou;Lee, Chang-Ho
    • Journal of the Korea Safety Management & Science
    • /
    • v.21 no.3
    • /
    • pp.11-16
    • /
    • 2019
  • The latest issue is the smart factory. In order to implement this smart factory, the most fundamental element is to establish product specifications for factors affecting the product, obtain useful data to analyzed and predicted, and maintain safety. But most manufacturers have many errors. Therefore, the purpose of this study is to verify factors of product through statistical techniques and to study the process control and safety.

Design and Implementation for Extraction of Field-Associationed Terms (분야연상어 추출 방법의 설계 및 구현)

  • Lee, Won-Hee;Choi, Hyun;Lee, Samuel Sangkon
    • Annual Conference of KIPS
    • /
    • 2004.05a
    • /
    • pp.651-654
    • /
    • 2004
  • 우리는 특정 문서를 읽을 때 문서 전체를 읽지 않더라도 대표적인 몇 개의 단어를 보는 것만으로 정치나 경제, 스포츠 등의 분야를 정확히 인지할 수 있다. 문서 전체를 대상으로 하지 않고 부분텍스트에서 출현하는 소수의 단어정보에서 문서의 분야를 정확히 결정하기 위해 분야연상어의 구축은 중요한 연구과제이다. 인간이 미리 분야체계를 정의하고, 각 분야에 해당하는 문서를 인터넷이나 서적을 통해 수집한다. 본 논문은 수집문서의 분야를 정확히 지시하는 분야연상어를 자동으로 수집하는 시스템을 설계하고 구현하는데 목적이 있다. 문서의 분야결정 시점을 고려하여 분야연상어의 수준, 안정성 랭크, 집중률, 빈도정보를 이용하여 단일 분야연상어를 수집하는 방법을 제안하고 구현한다.

  • PDF

Word Clustering Scheme for Twitter Sentiment Analysis Based on POS (트위터 감정 분석을 위한 POS 기반의 단어 군집화 기법)

  • Kim, Se-Jun;Lim, Hwan-Hee;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.31-32
    • /
    • 2019
  • 본 논문에서는 최근 빅데이터 활용 분야의 큰 이슈인 트위터 메시지의 효율적인 감정 분석을 위한 POS 기반의 단어 군집화 기법을 제안하였다. 기존에 군집화를 통한 다양한 텍스트 감정 분석 기법이 제시되어 왔으나, 군집화 된 기능과 분류 결과 간의 관련성에 대한 연구는 미흡하였다. 또한 모든 단어에 대한 감정 분석은 노이즈로 작용될 수 있는 단어로 인해 정확도가 감소할 수 있다. 본 논문에서는 이를 해결하기 위하여 Chi Square 기법을 통하여 분석 결과에 영향을 미치는 단어에 가중치를 부여함으로써 정확도를 향상시킨다.

  • PDF

A Comparative Analysis on External System of Software Education Unit in Practical Arts Textbooks based on 2015 Revised National Curriculum (2015 개정 실과 교과서 소프트웨어 교육 단원의 외적 체제 비교 분석)

  • Kim, Ji-Yun;Lee, Tae-Wuk
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.305-306
    • /
    • 2019
  • 2019학년도 초등학교 5-6학년군에 2015 개정 교육과정이 전면 적용된다. 본 논문에서는 2015 개정 교육과정에 따른 실과 검정 교과서 6종 소프트웨어 교육 단원의 외적 체제를 비교 분석하였다. 단원 체제 분석 결과 모든 교과서에 공통적으로 대단원명, 대단원 차례, 중단원명, 본문텍스트, 본문삽화, 용어 설명, 단원 마무리 등이 제시되어 있었다. 단원 구성 분석 결과 소프트웨어 교육 단원은 전체 교과서 분량의 18.8~25%까지 교과서별로 다양한 비율을 차지하고 있었다. 후속 연구로는 본 논문에서 다룬 교과서의 외적 체제 뿐 아니라 내적 체제 까지를 포함하여 각 교과서의 소프트웨어 교육 단원을 전체적인 틀에서 비교 분석 할 것이다.

  • PDF

Research Trend Analysis by using Text-Mining Techniques on the Convergence Studies of AI and Healthcare Technologies (텍스트 마이닝 기법을 활용한 인공지능과 헬스케어 융·복합 분야 연구동향 분석)

  • Yoon, Jee-Eun;Suh, Chang-Jin
    • Journal of Information Technology Services
    • /
    • v.18 no.2
    • /
    • pp.123-141
    • /
    • 2019
  • The goal of this study is to review the major research trend on the convergence studies of AI and healthcare technologies. For the study, 15,260 English articles on AI and healthcare related topics were collected from Scopus for 55 years from 1963, and text mining techniques were conducted. As a result, seven key research topics were defined : "AI for Clinical Decision Support System (CDSS)", "AI for Medical Image", "Internet of Healthcare Things (IoHT)", "Big Data Analytics in Healthcare", "Medical Robotics", "Blockchain in Healthcare", and "Evidence Based Medicine (EBM)". The result of this study can be utilized to set up and develop the appropriate healthcare R&D strategies for the researchers and government. In this study, text mining techniques such as Text Analysis, Frequency Analysis, Topic Modeling on LDA (Latent Dirichlet Allocation), Word Cloud, and Ego Network Analysis were conducted.

S-126 해양물리환경 국제표준에 대한 묘화 방안 제시

  • Kim, Myeong-Won;Choe, Hyeong-Gu;Go, Ji-Min;O, Se-Ung;Park, Cheol-Gyu;Gang, Tae-Sun
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2019.05a
    • /
    • pp.156-158
    • /
    • 2019
  • S-126 해양물리환경 국제표준에 대하여 S-101 전자해도 표준과 중첩하여 ECDIS(Electronic Chart Display and Information System) 상에 표현하는 방안에 대하여 연구하였다. 수로서지의 텍스트 기반 자료 형태인 해양물리현상을 기호화하여 전자해도에 중첩하여 표현함으로써 S-126 표준 정보를 ECDIS 사용자에게 보다 명확하게 전달하고, 그 결과 선박사고 및 안전항행에 기여할 것으로 기대된다.

  • PDF

A Study on Improvement of Hate Speech and Game Culture in Online Game (온라인 게임 내 혐오표현과 게임문화 개선에 대한 연구)

  • Kim, Mi-Seon;Yi, Do-young;Lee, Jong-won
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.299-302
    • /
    • 2019
  • 현재 게임을 즐기는 유저의 스펙트럼은 미취학 아동부터 노년에 이르기까지 매우 넓어졌다. 반면, 온라인 게임 내의 헤이트 스피치는 최근 사회적 문제로 대두되고 있다. 헤이트스피치 문제는 점차 심각해져가고 있지만 이 문제를 개선하기 위한 가이드라인은 명확히 제시되어 있지 않다. 본 논문에서는 온라인 게임 내 텍스트와 음성 채팅을 통해 발생하는 헤이트 스피치의 현황과 문제점을 알아보고 그에 대한 해결방향을 제시한다.

  • PDF

Context-sensitive Spelling Correction using Measuring Relationship between Words (단어 간 연관성 측정을 통한 문맥 철자오류 교정)

  • Choi, Sung-Ki;Kim, Minho;Kwon, Hyuk-Chul
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1362-1365
    • /
    • 2013
  • 한국어 텍스트에 나타나는 오류어의 유형은 크게 단순 철자오류와 문맥 철자오류로 구분할 수 있다. 이중 문맥 철자오류는 문맥의 의미 통사적 관계를 고려해야만 해당 어휘의 오류 여부를 알 수 있는 오류로서 철자오류 중 교정 난도가 가장 높다. 문맥 철자오류의 유형은 발음 유상성에 따른 오류, 오타 오류, 문법 오류, 띄어쓰기 오류로 구분할 수 있다. 본 연구에서는 오타 오류에 의해 발생하는 문맥 철자오류를 어의 중의성 해소와 같은 문제로 보고 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 방법을 제안한다. 미리 생성한 교정 어휘 쌍을 대상으로 교정 어휘 쌍의 각 어휘와 주변 문맥 간 의미적 연관성을 통계적으로 측정하여 문맥 철자오류를 검색하고 교정한다. 제안한 방법을 적용한 결과 3개의 교정 어휘 쌍 모두 90%를 넘는 정확도를 보였다.