• 제목/요약/키워드: 텍스트분류

검색결과 680건 처리시간 0.036초

유전자를 중간 매개로 고려한 동시발생 기반의 약물-질병 관계 추론 (Co-occurrence Based Drug-disease Relationship Inference with Genes as Mediators)

  • 신상원;신예은;장기업;윤영미
    • 한국정보기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.1-9
    • /
    • 2018
  • 신약 재창출은 현재 사용되는 약물의 새로운 용도를 발견하는 방법이다. 텍스트 마이닝은 정형화되지 않은 문서로부터 의미 있는 지식을 획득하는 과정을 의미한다. 본 논문에서는 약물-유전자와 유전자-질병에서 동시에 측정된 유전자 출현 빈도의 비율을 고려하여 새로운 약물-질병 관계를 추론하는 방법을 제안한다. 생물학적 문헌으로부터 약물-유전자와 유전자-질병의 동시출현 빈도를 측정하고 각 약물과 질병에 대하여 유전자의 출현 비율을 계산한다. 약물-질병 관계의 가중치는 동시에 측정된 유전자 출현 비율의 평균을 이용하여 계산되고 이를 이용하여 각 질병의 분류 정확도를 측정한다. 약물-질병 관계를 추론하는 것에서 동시출현 빈도를 문장 단위로 측정하고 여러 관계를 고려하는 방법이 기존 방법보다 더 정확히 식별해내는 것을 보였다.

대화시스템 미지원 도메인 검출에 관한 조사 (Survey on Out-Of-Domain Detection for Dialog Systems)

  • 정영섭;김영민
    • 융합정보논문지
    • /
    • 제9권9호
    • /
    • pp.1-12
    • /
    • 2019
  • 대화시스템은 인간과 컴퓨터 사이의 새로운 의사소통 수단으로 떠오르고 있다. 대화시스템은 인간의 음성을 입력으로 취하여, 적절한 음성 답변 또는 서비스를 제공하게 된다. 아마존 에코, 네이버 웨이브 등과 같은 대화시스템 제품들이 등장하고 있음에도 불구하고, 이 대화시스템들은 공통적으로 미지원 도메인을 제대로 처리하지 못한다는 문제점을 안고 있다. 이와 관련한 몇몇 연구들이 있었지만, 이 문제를 풀기 위한 더욱 많은 연구가 진행될 필요가 있다. 이 논문에서는, 미지원 도메인 검출과 관련한 기존 연구들에 대하여 3가지 관점, 즉 데이터, 자질, 방법에 대한 관점으로 요약한 정보를 제공한다. 데이터셋이 부족하다는 점으로 인해 타 연구분야에 비해 적은 연구가 수행되어왔으므로, 앞으로 가장 시급한 연구 주제는 대화시스템의 미지원 도메인 검출을 위한 공개용 데이터셋을 구축하고 배포하는 것이다.

위험사회 재난 안전 분야 대응을 위한 AI 조력자 (AI Advisor for Response of Disaster Safety in Risk Society)

  • 이용학;강윤희;이민호;박성호;강명주
    • Journal of Platform Technology
    • /
    • 제8권3호
    • /
    • pp.22-29
    • /
    • 2020
  • 4차 산업혁명은 초기 단순 제조업 혁신에서 사회 및 경제분야에서 다양한 기술적 융합 방향을 이끄는 메가 트랜드로서 국가별로 진행하고 있다. COVID-19와 같은 감염병의 유행은 디지털 중심의 비대면 비즈니스를 경제 운영에서 전환되고 있으며 온라인화 확산을 위해서는 개인 맞춤형서비스를 위한 AI와 빅데이터 기술의 활용은 필수적이다. 이 논문에서는 4차산업혁명을 주요한 기술 특징 및 정부에서 추진하는 디지털 뉴딜의 효과적 이행을 위해 핵심 기술인 인공지능기술의 적용을 중심으로 사례를 분석하고 재난대응 분야에서의 활용 사례를 기술한다. 재난대응 활용사례로서 AI 조력자는 긴급호출에서 신고자의 상태에 따른 적절한 대응책들을 제시한다. 이를 위해 AI 조력자는 적응적 대응을 위한 음성인식 데이터 기반 분석 및 변환 텍스트의 재난 분류를 제공한다.

  • PDF

자아 표현과 SNS 게시 형식: 고프만의 인상관리 이론을 중심으로 (Presentation of Self and SNS Posting Styles: Focusing on Goffman's Impression Management Framework)

  • 송승아;신형덕
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.284-291
    • /
    • 2022
  • 사람들은 본인의 자아를 표현하기 위해 다양한 수단을 사용하는데 소셜네트워크서비스(이하 SNS)도 그러한 수단 중 하나이다. 본 연구에서는 SNS에서 표현되는 자아의 유형을 고프만의 인상관리 이론에 등장하는 개념들에 기반하여 본연적, 이상적, 사회적 자아로 분류하고 각 유형의 자아를 표현하는 게시물이 특정한 게시 형식을 갖는가에 대해 조사했다. 특히 게시 형식으로서 텍스트와 이미지의 성격을 동시에 가지고 있는 해시태그의 사용에 주목하여 해시태그의 본문 혼용 여부, 해시태그의 숨김 기능 사용 여부, 그리고 해시태그에서의 용어의 특성에 주목했다. 인스타그램에서 수집한 450개의 게시물의 해시태그 사용 방식을 탐색적으로 조사한 결과 이상적 자아를 표현하는 게시물에서는 해시태그를 숨기고(98%) 일상적 용어를 사용하는(97%) 비율이 압도적으로 높았다. 이 결과는 고프만의 인상관리 이론이 시사하는 바와 같이 사람들은 본인의 가면을 쓴 모습에 대해 더욱 섬세한 인상관리를 한다는 것을 보여준다.

혁신특허전략 프레임워크의 체계적 운영 및 경쟁우위확보를 위한 특허빅테이터 활용방안에 관한 연구 (A study on the systematic operation of the innovative patent strategy framework and the application plan of patent big data to secure competitive advantage)

  • 김현아;차완규
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.351-357
    • /
    • 2021
  • 4차 산업혁명의 기술의 패러다임 전환기를 맞이하여 빅데이터 활용방안에 대한 관심이 대두되고 있는 시점에 특히 기업의 무형자산의 비중이 증가함에 따라 특허빅데이터의 활용방안에 대한 관심이 증대되고 있다. 특허 데이터는 정량적인 정보 외에 제목, 초록, 청구항 등의 비정형 텍스트와 인용 및 피인용 관계, 도면, 기술 분류 등 다양한 정보를 포함하고 있어 다양성의 측면에서도 빅데이터로 간주되어 특허 데이터에 대한 체계적인 관리에서부터 처리활용이 중요하다고 판단 된다. 이에 본 연구에서는 혁신특허전략 프레임워크의 체계적인 운영과 함께 기업의 근원적인 경쟁력 강화를 추진하여 강경쟁우위 확보를 추진하고자 특허빅데이터의 활용방안을 A사의 사례를 중심으로 제안하고, 이의 타당성을 검증하고 시사점을 제안하고자 한다. 이를 통해 특허빅데이터의 활용에 대한 인식을 제고하고, 기업의 전사전략, 사업전략, 기능전략과 연계한 특허빅테이터의 활용방안을 제시하고자 한다.

패션 속성기반 혼합현실 시각화 서비스 (Fashion attribute-based mixed reality visualization service)

  • 유용민;이경욱;김경선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.2-5
    • /
    • 2022
  • 딥러닝의 등장과 ICT(Information and Communication Technology)의 급속한 발전으로 정치, 경제, 문화 등 사회의 다양한 분야에서 인공지능을 활용한 연구가 활발히 진행되고 있다. 딥러닝 기반 인공지능 기술은 자연어 처리, 영상 처리, 음성 처리, 추천 시스템 등 다양한 영역으로 세분화된다. 특히, 산업이 고도화됨에 따라 시장 동향 및 개인의 특성을 분석하여 소비자에게 추천하는 추천 시스템의 필요성이 점점 더 요구되고 있다. 이러한 기술 발전에 발맞추어, 본 논문에서는 딥러닝 기반 '언어처리지능' 과 '영상처리지능'의 기술개발을 통해 정형 또는 비정형 텍스트 및 이미지 빅데이터로부터 속성 정보를 추출 추출하고, 분류하여 패션시장의 트랜드나 신규소재 등을 분석하고 소비자의 취향 분석을 통하여 '시장-소비자' 인사이트를 발굴하여, 스타일 추천, 가상 피팅, 및 디자인지원 등이 가능한 인공지능 기반 '맞춤형 패션 어드바이저' 서비스 통합 시스템을 제안한다.

  • PDF

딥러닝을 이용한 강좌 추천시스템 (Course recommendation system using deep learning)

  • 임민아;황승연;신동진;오재곤;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.193-198
    • /
    • 2023
  • 딥러닝을 이용한 학습자 맞춤 강의 추천 프로젝트를 연구한다. 추천시스템은 웹과 앱에서 쉽게 발견할 수 있으며 이 특성을 이용한 예제는 사용자 클릭으로 특성 영상 추천과 SNS에서 평소 사용자가 관심 있던 분야의 아이템을 광고하는 것이 있다. 본 연구에서는 문장 유사도인 Word2Vec를 주로 이용하여 2번의 필터링을 거쳤으며 Surprise 라이브러리를 통해 강좌 추천을 하였다. 이러한 시스템으로 사용자에게 간편하고 편리하게 원하는 분류의 강좌 데이터를 제공한다. Surprise 라이브러리는 Python scikit-learn 기반의 라이브러리이며 추천시스템에 편리하게 사용된다. 데이터를 분석하여 시스템을 빠른 속도로 구현하고 딥러닝을 사용하여 강좌 단계를 거쳐 보다 더 정밀한 결과를 구현해낸다. 사용자가 관심 있는 키워드를 입력하면 해당 키워드와 강좌 제목과의 유사도를 실행하고 추출된 영상 데이터로 또 음성 텍스트와의 유사도를 실행하여 추출된 데이터로 Surprise 라이브러리를 통해 가장 높은 순위의 영상 데이터를 추천한다.

모바일 헬스 애플리케이션의 감정인식 서비스 제안 (Proposal of Emotion Recognition Service in Mobile Health Application)

  • 하민아;이유진;박승호
    • 디자인융복합연구
    • /
    • 제15권1호
    • /
    • pp.233-246
    • /
    • 2016
  • 모바일 헬스 산업은 IT 기술과 융합하여 주목받고 있으며, 헬스 애플리케이션은 사용자의 건강한 라이프 스타일을 제공하는 방향으로 발전하고 있다. 본 연구는 4개의 모바일 헬스 애플리케이션을 선정하여 서비스의 동향을 살펴 보았고 그 결과 모두 신체 데이터 이외의 감정에 관한 데이터를 포함하고 있지 않고 있음을 알 수 있었다. 추가적으로 사용자의 감정을 추출을 위한 기술을 분류 및 분석하였고, 이를 통해 텍스트 기반 감정인식 기술이 모바일 헬스 서비스와 가장 적합하다고 판단하였다. 감정인식 서비스를 구현하고자 소셜 네트워크 서비스와 1차원 감정 모델을 시스템의 소스로 설정한 감정인식 시스템의 프로세스 설계를 하여 개발하였다. 뿐만 아니라, 본 시스템이 모바일 헬스 애플리케이션에서 어떻게 사용 가능할지 제안하고자 설득형 기술과 결합하였다. 결과적으로 사용자의 5가지 감정과 감정이 지속되는 시간에 따른 15가지의 제안을 포함하는 가이드라인과 구체적 서비스 방안 제안하였다. 이에 본 연구는 기존의 헬스 애플리케이션이 정신적 건강, 감정적 건강과 같은 개인의 심리적 컨텍스트까지 고려하는 제안형 서비스로 나아가기 위한 지침이 될 것으로 기대하는 바이다.

잠재적 차량 결함 탐지를 위한 비정형 고객불만 텍스트 데이터 분류 (Classification of Unstructured Customer Complaint Text Data for Potential Vehicle Defect Detection)

  • 조주현;옥창수;박재일
    • 산업경영시스템학회지
    • /
    • 제46권2호
    • /
    • pp.72-81
    • /
    • 2023
  • This research proposes a novel approach to tackle the challenge of categorizing unstructured customer complaints in the automotive industry. The goal is to identify potential vehicle defects based on the findings of our algorithm, which can assist automakers in mitigating significant losses and reputational damage caused by mass claims. To achieve this goal, our model uses the Word2Vec method to analyze large volumes of unstructured customer complaint data from the National Highway Traffic Safety Administration (NHTSA). By developing a score dictionary for eight pre-selected criteria, our algorithm can efficiently categorize complaints and detect potential vehicle defects. By calculating the score of each complaint, our algorithm can identify patterns and correlations that can indicate potential defects in the vehicle. One of the key benefits of this approach is its ability to handle a large volume of unstructured data, which can be challenging for traditional methods. By using machine learning techniques, we can extract meaningful insights from customer complaints, which can help automakers prioritize and address potential defects before they become widespread issues. In conclusion, this research provides a promising approach to categorize unstructured customer complaints in the automotive industry and identify potential vehicle defects. By leveraging the power of machine learning, we can help automakers improve the quality of their products and enhance customer satisfaction. Further studies can build upon this approach to explore other potential applications and expand its scope to other industries.

멀티 파티 시스템에서 딥러닝을 위한 프라이버시 보존 기술 (Privacy Preserving Techniques for Deep Learning in Multi-Party System)

  • 고혜경
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.647-654
    • /
    • 2023
  • 딥러닝은 이미지, 텍스트와 같이 복잡한 데이터를 분류 및 인식하는데 유용한 방법으로 딥러닝 기법의 정확도는 딥러닝이 인터넷상의 AI 기반의 서비스를 유용하게 하는데 기초가 되었다. 그러나 딥러닝에서 훈련에 사용되는 방대한 양의 사용자 데이터는 사생활 침해 문제를 야기하였고 사진이나 보이스와 같이 사용자이 개인적이고 민감한 데이터를 수집한 기업들이 데이터들을 무기한으로 소유한다. 사용자들은 자신의 데이터를 삭제할 수 없고 사용되는 목적도 제한할 수 없다. 예를 들면, 환자 진료기록에 대한 딥러닝 기술을 적용하기 원하는 의료기관들과 같은 데이터소유자들은 사생활과 기밀유지 문제로 환자의 데이터를 공유할 수 없고 딥러닝 기술의 혜택을 받기 어렵다. 우리는 멀티 파티 시스템에서 다수의 작업자들이 입력 데이터집합을 공유하지 않고 신경망 모델을 공동으로 사용할 수 있는 프라이버시 보존 기술을 적용한 딥러닝 방법을 설계한다. 변형된 확률적 경사 하강에 기초한 최적화 알고리즘을 이용하여 하위 집합을 선택적으로 공유할 수 있는 방법을 이용하였고 결과적으로 개인정보를 보호하면서 학습 정확도를 증가시킨 학습을 할 수 있도록 하였다.