• Title/Summary/Keyword: text input

검색결과 358건 처리시간 0.026초

순환신경망 기초 실습 사례 개발 (Development of Basic Practice Cases for Recurrent Neural Networks)

  • 허경
    • 실천공학교육논문지
    • /
    • 제14권3호
    • /
    • pp.491-498
    • /
    • 2022
  • 본 논문에서는 비전공자들을 위한 교양과정으로, 기초 순환신경망 과목 커리큘럼을 설계하는데 필수적으로 요구되는 순환신경망 SW 실습 사례를 개발하였다. 개발된 SW 실습 사례는 순환신경망의 동작원리를 이해시키는 데 초점을 두고, 시각화된 전체 동작 과정을 확인할 수 있도록 스프레드시트를 사용하였다. 개발된 순환신경망 실습 사례는 지도학습 방식의 텍스트완성 훈련데이터 생성, 입력층, 은닉층, 상태층(컨텍스트 노드) 그리고 출력층을 차례대로 구현하고, 텍스트 데이터에 대해 순환신경망의 성능을 테스트하는 것으로 구성되었다. 본 논문에서 개발한 순환신경망 실습사례는 다양한 문자 수를 갖는 단어를 자동 완성한다. 제안한 순환신경망 실습사례를 활용하여, 한글 또는 영어 단어를 구성하는 최대 문자 수를 다양하게 확장하여 자동 완성하는 인공지능 SW 실습 사례를 만들 수 있다. 따라서, 본 순환신경망 기초 실습 사례의 활용도가 높다고 할 수 있다.

사용자 리뷰의 평가기준 별 이슈 식별 방법론: 호텔 리뷰 사이트를 중심으로 (Methodology for Identifying Issues of User Reviews from the Perspective of Evaluation Criteria: Focus on a Hotel Information Site)

  • 변성호;이동훈;김남규
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.23-43
    • /
    • 2016
  • 최근 IT기술의 발전에 따라 많은 사람들이 자신들의 여가활동에 대한 경험을 공유하고 있으며, 역으로 다른 사람들의 여가활동에 대한 경험을 참고하여 더 나은 여가활동을 누릴 수 있는 기회를 얻게 되었다. 이러한 현상은 영화, 숙박, 음식, 여행 등 여가활동 전반에 걸쳐 나타나고 있으며, 그 중심에는 여가활동에 대한 정보를 요약하여 제공하는 수많은 사이트가 있다. 대부분의 여가활동 정보 사이트는 각 상품에 대한 평균 평점뿐만 아니라 상세 리뷰를 제공함으로써, 해당 상품을 구매하고자 하는 잠재고객의 의사결정을 지원하고 있다. 하지만 기존 대부분의 사이트는 한 단계의 평가기준에 따라 평점과 리뷰를 제공하기 때문에, 각 평가기준을 구성하는 세부요소에 대한 특징과 평가기준 별 주요 이슈를 파악하기 위해서는 상당히 많은 수의 리뷰를 직접 읽어야 한다는 불편이 따른다. 즉 사용자는 자신이 중요한 것으로 생각하는 평가기준에 대한 조건을 파악하기 위해, 많은 수의 리뷰를 하나하나 읽어보는 과정에서 많은 시간과 노력을 소비하게 된다. 예를 들어 호텔의 접근성, 객실, 서비스, 음식 등 한 단계의 평가기준만을 사용하여 평점과 리뷰를 제공하는 사이트의 경우, 접근성 중 특히 지하철역과의 거리, 객실 중 특히 욕실의 상태를 살펴보고자 하는 사용자에게 필요한 정보를 충분히 제공하지 못하게 된다. 따라서 본 연구에서는 기존 여가활동 정보 사이트의 한계, 즉 평가기준별로 입력된 리뷰를 신뢰하기 어렵다는 점과 평가기준을 구성하고 있는 세부 내용을 파악하기 어렵다는 점을 극복하기 위한 방안을 제시하고자 한다. 본 연구에서 제안하는 방법론은 사용자가 별도의 구분 없이 입력한 리뷰를 그 내용에 따라 평가기준별로 자동 분류하고, 각 평가 기준 별 주요 이슈를 요약하여 제공한다. 제안 방법론은 최근 텍스트 분석에 활발하게 사용되고 있는 토픽 모델링(Topic Modeling)에 기반을 두고 있으며, 각 리뷰를 하나의 문서 단위로 사용하는 것이 아니라 리뷰를 문장 단위로 끊어 개별 리뷰 유닛(Review Unit)으로 분해한 뒤, 평가기준별로 리뷰 유닛을 재구성하여 분석한다는 측면에서 기존의 토픽 모델링 기반 연구와 큰 차이가 있다고 할 수 있다. 본 논문에서는 제안 방법론을 실제 호텔 정보 사이트에서 수집한 423건의 리뷰 문서에 적용하여 6가지 평가기준에 대해 총 4,860건의 리뷰 유닛을 재구성하고, 이에 대한 분석 결과를 소개함으로써 제안 방법론의 유용성을 간접적으로 보인다.

픽프라이머 : 유전자 목표 구간 탐색 모듈을 포함한 프라이머 제작 그래픽 프로그램 (Pickprimer: A Graphic User Interface Program for Primer Design on the Gene Target Region)

  • 정희;문정환;이성찬;유희주
    • 원예과학기술지
    • /
    • 제29권5호
    • /
    • pp.461-466
    • /
    • 2011
  • 유전 육종 연구를 위해 연구자들은 실험 목적에 따라 다양한 종류의 프라이머를 제작해야 한다. 인터넷 상에서 다양한 공용 프로그램이 이용되고 있으나 많은 경우 사용자 편의성이 낮기 때문에 유전자의 구조를 고려하여 프라이머를 디자인하기 위해서는 시간과 노력이 소요된다. 본 연구에서는 엑손과 인트론 지역을 시각적으로 구별하면서 손쉽게 프라이머를 제작할 수 있는 프로그램인 Pickprimer를 개발하였다. 이 프로그램은 공용 프로그램인 Spidey와 Primer3 프로그램의 소스 코드를 결합한 후 그래픽 인터페이스를 추가하여 사용자가 유전자의 구조를 예측하고 이를 바탕으로 프라이머를 손쉽게 제작할 수 있게 했다. 입력 정보는 공용 데이터베이스에서 내려 받은 서열을 복사-붙임하여 이용할 수 있게 하였으며, 유전자의 구조를 그림으로 표현하고 동시에 엑손과 인트론 서열을 구별할 수 있게 했다. 이 프로그램을 이용하여 배추의 단일 카피 유전자에 대한 24 쌍의 프라이머를 디자인하고 6개 고정 품종을 대상으로 PCR과 전기영동 실험을 수행한 결과 제작한 모든 프라이머 쌍이 명확한 단일 밴드를 성공적으로 증폭시켰다. 이 프로그램은 분자표지의 개발뿐만 아니라 유전자 기능 연구 등 다양한 종류의 유전 육종 실험에 유용하게 이용될 수 있을 것으로 기대된다.

스크립트 언어를 사용한 DSSAT 모델 기반 격자형 작물 생육 모의 시스템 개발 (Development of a gridded crop growth simulation system for the DSSAT model using script languages)

  • 유병현;김광수;반호영
    • 한국농림기상학회지
    • /
    • 제20권3호
    • /
    • pp.243-251
    • /
    • 2018
  • 작물 생산량의 시 공간적 분석은 정책입안자와 이해관계자들에게 중요한 정보를 제공할 수 있으나, 이를 위해서는 공간적 기상자료를 처리하고 이에 맞추어 작물 모형을 구동할 수 있는 작업들이 필요하다. 이에 따라 DSSAT (Decision Support System for Agrotechnology Transfer)을 기반으로 지역내 작물 생산성 자료를 생산할 수 있는 자동화 시스템을 개발하고자 하였다. 이 시스템은 전문적인 컴퓨터 프로그래머가 아니더라도 사용가능한 R과 shell script를 기반으로 개발되었다. 먼저, 격자형 기상자료의 각 격자에 해당하는 정보를 텍스트 형식의 기상 입력자료 형식으로 변환하는 기능을 가지는 모듈을 작성하였다. 다음으로 R 패키지를 사용하여 GIS자료 처리와 병렬 처리기능이 구현된 R script을 작성하였다. 또한, 작물 모델을 자동으로 구동하는 기능을 shell script를 사용하여 구현하였다. 사례 연구로, 미국 Illinois 주에서 콩의 최대 수량을 얻을 수 있는 재배관리 조건의 공간적인 분포를 파악하고자 하였다. 개발된 도구를 통해 AgMERRA 자료로부터 Illinois 주의 1981 - 2005년 까지의 기상입력자료를 생산하였다. 해당 지역에서 1개의 CPU 코어를 사용하여 1년간의 자료를 처리하기 위해 7.38 시간이 걸렸으나, 병렬처리를 통해 16개의 CPU 코어를 사용하였을 때 처리 시간이 크게 줄어, 35분만에 처리가 가능하였다. 이렇게 생산된 기상 입력자료들을 작물 모형 자동 구동 시스템에 활용하여 해당 지역에서의 최대 수량과, 최대 수량을 가지는 성숙군 및 파종일 지도를 작성할 수 있었다. 특히, 본 연구에서 개발된 도구는 DSSAT 모델뿐만 아니라 국내에서 사용되는 다른 작물모델들에게 적용될 수 있어 공간적 작물 생산성 평가에 도움을 줄 수 있을 것으로 보인다.

B-Spline 곡선을 이용한 터치펜 잡음제거 (Touch-Pen Noise Reduction Using B-Spline Function)

  • 이상범
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.121-126
    • /
    • 2017
  • 최근에 터치펜이 내장된 모바일 기기가 증가하고 있다. 터치가 가능한 디바이스는 펜을 터치 보드에 접속하는 순간부터 신호의 정확도와 반응 속도가 매우 중요하다. 따라서 터치 신호에 포함된 잡음을 빠르고 효과적으로 제거할 수 있는 방법에 대한 연구가 필요하다. 본 논문에서는 터치스크린에 펜으로 입력된 터치 포인트 좌표에 섞인 노이즈를 제거하는 방법을 제안한다. 효과적인 필터링을 위해서는 먼저 입력된 신호 중에서 노이즈에 해당하는 좌표를 빠르게 Sampling함으로써 노이즈를 1차적으로 제거 한다. 그 다음으로 터치 좌표의 전체보정을 위해 B-Spline 곡선의 특성을 이용하여 좌표의 포인트를 보정하게 된다. 이는 다른 알고리즘들 보다 실시간성을 보장할 수 있다. 성능 평가 방법은 터치패드에 대각선을 10개의 구간을 나누어 오차 픽셀들을 기준 값들과 비교 평가하였다. 평균 오차는 7.1픽셀이며, 우리가 제안한 방법은 평균 4.1오차를 보였다. 따라서 우리가 제안한 방법을 이용하여 정확한 좌표에 표현 할 수 있는 터치 펜 시스템을 제시하였다.

Bidirectional LSTM CRF 기반의 개체명 인식을 위한 단어 표상의 확장 (Expansion of Word Representation for Named Entity Recognition Based on Bidirectional LSTM CRFs)

  • 유홍연;고영중
    • 정보과학회 논문지
    • /
    • 제44권3호
    • /
    • pp.306-313
    • /
    • 2017
  • 개체명 인식이란 문서 내에서 인명, 기관명, 지명, 시간, 날짜 등 고유한 의미를 가지는 개체명을 추출하여 그 종류를 결정하는 것을 말한다. 최근 개체명 인식 연구에서 가장 우수한 성능을 보여주고 있는 모델은 Bidirectional LSTM CRFs 모델이다. 이러한 LSTM 기반의 딥 러닝 모델은 입력이 되는 단어 표상에 의존적이다. 따라서 입력이 되는 단어를 잘 표현하기 위하여 단어 표상을 확장하는 방법에 대한 연구가 많이 진행되어지고 있다. 본 논문에서는 한국어 개체명 인식을 위하여 Bidirectional LSTM CRFs모델을 사용하고, 그 입력으로 사용되는 단어 표상을 확장하기 위해 사전 학습된 단어 임베딩 벡터, 품사 임베딩 벡터, 음절 기반에서 확장된 단어 임베딩 벡터, 그리고 개체명 사전 자질 벡터를 사용한다. 최종 단어 표상 확장 결과 사전 학습된 단어 임베딩 벡터만 사용한 것 보다 8.05%p의 성능 향상을 보였다.

스마트폰 애플리케이션을 위한 임베디드형 피드백 지원 검색체 (Embeded-type Search Function with Feedback for Smartphone Applications)

  • 강문중;황민태
    • 한국정보통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.974-983
    • /
    • 2017
  • 본 논문에서는 안드로이드 기반의 각종 어플리케이션에 내장시켜 사용가능한 검색체에 대해 연구하였다. 이를 위해 조사와 같이 무의미하지만 자주 사용되는 단어를 빈도수에 따라 억제하는 BM25, 아이템의 길이 편차에 따른 검색 순위 문제를 해결하기 위해 아이템의 길이에 따라 중요도를 보정하는 Pivoted Length Normalization, 그리고 벡터공간 모형 상에서 쿼리 벡터를 관련 있는 것으로 판정된 아이템들의 벡터 그룹으로 끌어당겨 보정하는 Rocchio's Method를 사용해 묵시적 피드백 기능을 지원하도록 하였다. 그리고 색인 작업은 오프라인 동작을 위한 간단 색인과 온라인 동작을 위한 정밀 색인의 두 단계로 나누어 동작성을 보장하도록 하였다. 본 논문에서 연구한 피드백 지원 검색체는 쿼리 유추를 통해 사용자의 입력을 색인된 자료와 비교해 입력 내용을 예측하고 오타 등의 사용자 실수에 대해서도 대응하므로 스마트폰 어플리케이션에 손쉽게 탑재되어 검색 기능을 향상시킬 수 있을 것으로 기대한다.

수기정보 전자화 기술 기반의 농축산물 생산이력정보 수집 시스템 (A Production Traceability Information Gathering System based on Handwritten Data Digitalization Technology in Agro-livestock Products)

  • 손봉기
    • 한국산학기술학회논문지
    • /
    • 제12권10호
    • /
    • pp.4632-4641
    • /
    • 2011
  • 이 논문에서는 농축산물 이력추적관리제의 성공적 도입 및 확대에 있어 중요한 기반요소인 생산이력정보를 효율적으로 수집할 수 있는 수기정보 전자화 기술 기반의 농축산물 생산이력정보 수집 시스템을 제안한다. 제안 시스템은 디지털펜으로 종이문서 형태의 관리대장 작성만으로 기록 대장과 동일한 디지털이미지를 생성하고, 필기체인식을 통해 기록 내용을 데이터베스화한다. 제안 시스템은 PC, PDA, 터치스크린 등의 정보 수집기기에 비해 이동성, 사용 편이성, 데이터 입력 속도 측면에서 뛰어나고, 열악한 농축산 작업 환경에서 사용하기 적합하기 때문에 전산능력과 시간적 여유가 없는 농가에서 효율적으로 양질의 생산이력정보를 수집할 수 있다. 수기정보 전자화 기술은 가공, 유통, 판매 단계의 종이문서 기반 정보취득 업무에 적용될 수 있으며, RFID/USN 기반 시스템과 연동하여 고도화된 이력추적관리 시스템 구축에 사용될 수 있다.

주의집중 및 복사 작용을 가진 Sequence-to-Sequence 순환신경망을 이용한 제목 생성 모델 (Title Generation Model for which Sequence-to-Sequence RNNs with Attention and Copying Mechanisms are used)

  • 이현구;김학수
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.674-679
    • /
    • 2017
  • 대용량의 텍스트 문서가 매일 만들어지는 빅데이터 환경에서 제목은 문서의 핵심 아이디어를 빠르게 집어내는데 매우 중요한 단서가 된다. 그러나 블로그 기사나 소셜 미디어 메시지와 같은 많은 종류의 문서들은 제목을 갖고 있지 않다. 본 논문에서는 주의집중 및 복사 작용을 가진 sequence-to-sequence 순환신경망을 사용한 제목 생성 모델을 제안한다. 제안 모델은 양방향 GRU(Gated Recurrent Unit) 네트워크에 기반 하여 입력 문장을 인코딩(encoding)하고, 입력 문장에서 자동 선별된 키워드와 함께 인코딩된 문장을 디코딩함으로써 제목 단어들을 생성한다. 93,631문서의 학습 데이터와 500문서의 평가 데이터를 가진 실험에서 주의집중 작용방법이 복사 작용방법보다 높은 어휘 일치율(ROUGE-1: 0.1935, ROUGE-2: 0.0364, ROUGE-L: 0.1555)을 보였고 사람이 정성평가한 지표는 복사 작용방법이 높은 성능을 보였다.

사운드 데이터의 3D 시각화 방법 (Method for 3D Visualization of Sound Data)

  • 고재혁
    • 디지털융복합연구
    • /
    • 제14권7호
    • /
    • pp.331-337
    • /
    • 2016
  • 본 연구의 목적은 사운드 데이터를 3차원 입체 이미지로 시각화하는 방법을 제공하는 것이다. 사운드 데이터의 시각화는 사운드데이터의 음역채널을 텍스트베이스형태의 스크립트 제작한 후 설정된 알고리즘에 따라 수행한다. 알고리즘은 음역 채널 설정단계, 사운드 시각화용 화면프레임 설정단계, 단위 입체이미지 구현체 특성정보 설정단계, 사운드 데이터 음역 채널 검출단계, 사운드 시각화단계등 총 5단계로 이루어지며, 마우스등의 입력장치로 최소한된 입력신호조작으로 3D 시각화를 수행한다. 일반적인 방법으로 애니메이터가 할 수 없는 양을 가진 사운드 파일을 이용해, 애니메이터가 작업하는 시간과 제시한 연구방법을 이용한 작업시간을 비교하여, 본 연구에서 제시한 3D 시각화 방법이 창의적 예술적 이미지를 제작에 저비용, 고효율 방법임을 부각하였다. 향후, 게임엔진에서 렌더링 과정을 거치지 않는 방법으로 사운드 데이터의 실시간 시각화 방법을 연구할 예정이다.