• 제목/요약/키워드: 언어네트워크 분석

검색결과 277건 처리시간 0.029초

소셜네트워크서비스에 활용할 비표준어 한글 처리 방법 연구 (Research on Methods for Processing Nonstandard Korean Words on Social Network Services)

  • 이종화;레환수;이현규
    • 한국산업정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.35-46
    • /
    • 2016
  • 특정한 관심이나 활동을 공유하는 관계망을 구축해주는 온라인 서비스인 소셜네트워크서비스(SNS), 자신의 관심사에 따라 자유롭게 글, 사진, 동영상 등을 올릴 수 있는 공간인 블로그(Blog) 등은 자신을 알리고 표현하는 사회현상으로 자리 매김하고 있다. 이러한 SNS나 블로그를 통해 사용자들이 자유롭게 표현한 글들을 분석하여 의미있는 정보와 가치, 그리고 패턴을 찾기 위한 텍스트 마이닝(Text Mining), 오피니언 마이닝(Opinion Mining), 의미 분석(Semantic Analysis) 등의 연구가 활발히 이루어지고 있다. 또한, 연구자들의 연구 효율을 보다 높이기 위하여 키워드 기반 연구들도 이루어져있다. 하지만 대부분의 연구들은 한글의 맞춤법에 많은 한계점을 나타내고 있다. 본 연구는 어근을 찾기 힘든 이상한 외계 언어, 무분별하게 표현되는 속어, 알기 힘든 한글 이모티콘 인터넷 언어, 마이닝 처리 과정에서 파악하기 어려운 단어들을 데이터베이스에 구축하여 데이터 사전 기반 마이닝 처리 기법의 한계를 극복하고자 한다. 특정 주제에 대한 주관적 견해로 구성된 블로그를 사례 분석 대상으로 연구를 진행하였으며 유니코드를 활용한 비표준어 추출은 텍스트 마이닝 처리에 유용함을 발견할 수 있었다.

바이트코드 최적화기 (The Bytecode Optimizer)

  • 이야리;홍경표;오세만
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.73-80
    • /
    • 2003
  • 자바언어는 인터넷 및 분산 환경 시스템에서 효과적으로 응용 프로그램을 개발할 수 있도록 설계된 프로그래밍 언어로써 객제지향 패러다임 특성 및 다양한 개발 환경을 지원하고 있다. 그러나, 자바는 클래스 파일이 이동하여 JVM 환경에서 인터프리팅 되는 시스템이므로, 성능의 저하 없이 실행되기 위해서는 효율적인 최적화와 실행 시스템이 요구된다. 본 논문은 네트워크 상에서 동적으로 다운로드 되는 클래스 파일을 바이트코드 수준에서 최적화하였다. 최적화된 바이트코드들이 인터프리팅 되는 시스템에서 적은 네트워크 로드를 가지고 실행할 수 있도록 하며, 효율적인 실행 속도를 보이도록 하는 것이다. 본 논문에서 구현된 바이트코드 최적화기에서는 내부적으로 바이트코드 최적화기와 클래스 파일 생성기를 이용하여 실행시간을 개선하고 전체 클래스 파일의 크기를 줄이게 된다. 바이트코드 최적화기는 바이트코드를 클래스사이의 계층 분석과 제어 흐름의 분석을 통하여 클래스들간의 연관 관계를 분석한 후 그래프를 구성하고, 패턴 탐색 결과 기본 블록 분리를 통하여 전역 최적화를 이루고, 기본 블록 안에서의 연산강도 경감, 그리고 도달할 수 없는 코드 블록의 제거를 수행한다. 바이트코드 최적화 단계를 수행한 클래스 파일은 부분적으로 클래스 파일의 최적화를 가져와 전체 클래스 파일의 크기를 줄이고, 인터프리터를 통하여 실행될 때 수행 속도 면에서 좀더 빠른 실행속도를 가지게 된다.

커뮤니티 기반의 실시간 질의응답 시스템 (Community based real time Q&A System)

  • 윤원범;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.123-125
    • /
    • 2011
  • 본 논문은 스마트 디바이스와 소셜네트워크의 커뮤니티 기능을 활용하여 정보와 지식을 위한 실시간 질의응답 시스템을 제안한다. 정보와 지식의 양이 증가 하고 인터넷과 스마트 디바이스의 발전으로 인하여 지식검색의 필요성이 증대되고 있다. 하지만 현재 컴퓨터는 사용자의 질문을 정확히 이해하고 관련된 답변을 제공해주기 어렵다. 본 논문에서 제안하는 질의응답 시스템은 스마트 디바이스를 이용하고 SNS와 같이 커뮤니티 기반의 서비스를 적용한 실시간 커뮤니티형 질의응답 시스템이다. 사용자의 질문을 분석하여 관심사가 같은 사용자들을 그룹화 하고 관심사가 같은 사용자끼리 질문과 답변을 할 수 있는 서비스를 제공하여 질문과 답변을 효율적으로 주고받을 수 있다. 또한 사용자 피드백을 적용하여 사용자 랭킹을 보여줌으로써 사용자들의 답변률을 향상 시키고 스팸성 답변자에게 제한을 할 수 있는 시스템을 제안한다.

  • PDF

BERT 기반 End-to-end 신경망을 이용한 한국어 상호참조해결 (Korean End-to-end Neural Coreference Resolution with BERT)

  • 김기훈;박천음;이창기;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.181-184
    • /
    • 2019
  • 상호참조해결은 주어진 문서에서 상호참조해결 대상이 되는 멘션(mention)을 식별하고, 같은 개체(entity)를 의미하는 멘션을 찾아 그룹화하는 자연어처리 태스크이다. 한국어 상호참조해결에서는 멘션 탐지와 상호참조해결을 동시에 진행하는 end-to-end 모델과 포인터 네트워크 모델을 이용한 방법이 연구되었다. 구글에서 공개한 BERT 모델은 자연어처리 태스크에 적용되어 많은 성능 향상을 보였다. 본 논문에서는 한국어 상호참조해결을 위한 BERT 기반 end-to-end 신경망 모델을 제안하고, 한국어 데이터로 사전 학습된 KorBERT를 이용하고, 한국어의 구조적, 의미적 특징을 반영하기 위하여 의존구문분석 자질과 개체명 자질을 적용한다. 실험 결과, ETRI 질의응답 도메인 상호참조해결 데이터 셋에서 CoNLL F1 (DEV) 71.00%, (TEST) 69.01%의 성능을 보여 기존 연구들에 비하여 높은 성능을 보였다.

  • PDF

통계적 방법을 활용한 객관적 언어정보 도출 - 학제적 연구의 가능성 모색 (The deduction of objective linguistic information using statistical methods - The grouping of the possibility of interdisciplinary research)

  • 최경호;이용욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권1호
    • /
    • pp.49-55
    • /
    • 2011
  • 최근 들어 여러 영역에서 통섭을 통한 융합을 이루려는 시도가 자주 나타난다. 학문에 있어서도 예외는 아닌바, 학제적 연구가 그 예라 하겠다. 통계학과 관련된 학제적 연구의 한 분야로 언어정보학 또는 계량언어학이라 일컬어지는 언어학 연구가 있다. 그런데 통계학과 언어학의 학제적 연구는 주로 언어학자들을 중심으로 이루어져 오고 있다. 따라서 통계학적인 측면에서 보면 언어학자들의 연구결과에 일부 부족한 부분이 분명 존재한다. 이에 본 연구에서는 일부 언어학 연구에서 나타나는 객관성확보의 부족한 면에 대한 보완을 통계적인 방법을 이용하여 수행함으로써, 통계학과 언어학의 '학제적연구'의 완성도를 높일 수 있는 방안에 대해 고찰해 보았다. 부언하면 본 연구에서는 언어학 연구에서 보다 객관적인 언어정보를 도출하는데 도움이 될 수 있는 여러 통계적인 방법들을 소개하고 응용 예를 보였다.

데이터베이스에 기반한 UML 모델 관리시스템 (Database Supported System for UML Models Management)

  • 이성대;박휴찬
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2002년도 춘계학술대회논문집
    • /
    • pp.73-80
    • /
    • 2002
  • UML(Unified Modeling Language)은 소프트웨어 설계뿐만 아니라 네트워크 상에서의 데이터 전송, 가상데이터를 이용한 물리현상, 회로 분석 및 설계 등 다양한 형태의 시뮬레이션에서도 사용되고 있는 모델링 언어이다. 이러한 UML로 개발된 소프트웨어 설계 모델이나 시뮬레이션 모델들을 효율적으로 저장하고 관리할 수 있는 통합 시스템의 필요성이 제기되고 있다. 이를 위하여 본 논문에서는 UML 모델들의 저장과 관리의 효율성을 높이기 위해서 저장하부 구조를 데이터베이스화할 수 있는 방법을 제안한다. 제안한 방법을 적용한 시스템은 UML 모델들을 다수의 사용자들이 서로 공유할 수 있으며 모델의 재사용성을 높이고 모델 정보의 효율적인 검색을 지원할 것이다.

  • PDF

자동 초록을 위한 지식 기반 시스템 설계에 관한 연구 (A Study on the Knowledge-Based System for Automaic Abstracting)

  • 최인숙
    • 정보관리학회지
    • /
    • 제6권1호
    • /
    • pp.93-117
    • /
    • 1989
  • 본 연구에서는 자연언어 텍스트 분석을 통해 초록을 생성하기 위하여 특정 주제분 야의 지식에 입각하여 운영되는 지식 기반 시스템을 설계하였다. 주제 영역은 상표법 관계 대법원 판결서를 대상으로 하였으며 지식 베이스는 판결서의 내용을 담을 수 있는 틀과 상 표법 조문 지식, 상품 구분 지식을 프레임과 의미 네트워크로 표현하여 구성하였다. 초록을 생성하는 과정은 (1) 텍스트를 이해하기 위하여 필요한 주제분야지식을 미리 체계적으로 조 직하여 지식 베이스를 구성하고 주요 정보가 들어갈 자리를 괄호로 둔 채 그 정보들을 연결 하는 일반적인 내용만 기술한 예비 초록을 각 경우별로 준비한 다음 (2) 이러한 지식에 입 각하여 입력 테스트를 분석하고 초록에 필요한 주요 정보를 추출하며 (3) 입력 테스트에 해 당하는 예비 초록을 호출하여 그의 괄호 안에 필요한 정보를 채워 초록을 완성하는 3 단계 로 구성된다.

  • PDF

키워드 네트워크 분석을 통한 난독증과 학습장애 관련 연구 동향 분석 (A Study on the Research Trend in the Dyslexia and Learning Disability Trough a Keyword Network Analysis)

  • 이우진;김태강
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.91-98
    • /
    • 2019
  • 본 연구는 난독증과 학습장애 관련 연구 동향과 키워드 네트워크 분석을 통한 관련 변인의 중심성을 알아보는데 그 목적이 있다. 2008년부터 2018년까지 학술교육학술정보원에서 제공하는 학술연구정보서비스 사이트 데이터베이스를 활용하여 연구 목록을 수집하였다. 분석대상으로 선정된 407편의 연구 주제는 키워드 클렌징 작업을 거쳐 KrKwic 프로그램을 이용하여 주요 키워드를 추출하였고 키워드 간 연결중심성을 시각화를 하기 위해 NodeXL프로그램을 활용하였다. 분석결과 다음과 같은 연구결과를 도출하였다. 첫째, 난독증과 학습장애 연구주제 총 72개의 키워드가 추출되었고 주요키워드에는 학습장애, 읽기장애, 난독증, 중재반응모형 순으로 제시하고 있었다. 둘째, 난독증과 학습장애의 관련 매개 키워드 중심성을 분석한 결과 학습장애가 국내 난독증 및 학습장애 관련 연구에서 주요한 키워드로 볼 수 있다. 이러한 연구결과를 통해 난독증과 학습장애와 관련해 정량적 분석과 정성적 분석을 절충한 연구동향 분석방법을 제시하였다는 점에서 의의가 있다고 할 수 있다.

키워드 기반 주제중심 분석을 이용한 비정형데이터 처리 (Unstructured Data Processing Using Keyword-Based Topic-Oriented Analysis)

  • 고명숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.521-526
    • /
    • 2017
  • 데이터는 데이터 형식이 다양하고 방대할 뿐만 아니라 그 생성 속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 관리 및 분석 방법이 요구된다. 소셜 네트워크 상의 온라인 문서에서 인간의 언어로 쓰여진 비정형 텍스트에서 Text Mining기법을 사용하여 유용한 정보를 추출할 수 있다. 소셜미디어에 남긴 정치, 경제, 문화에 대한 메시지에 대한 경향을 파악하는 것이 어떤 주제에 관심을 가지고 있는지를 파악할 수 있는 요소가 된다. 본 연구에서는 주제 중심 분석 기법을 이용하여 주어진 키워드에 관한 온라인 뉴스를 대상으로 텍스트 마이닝을 수행하였다. LDA(Latent Dirichiet Allocation)를 이용하여 웹문서로부터 정보를 추출하고 이로부터 사람들이 실제로 주어진 키워드에 대하여 어떤 주제에 관심이 있고 관련된 핵심 가치 중 어떤 주제를 중심으로 전파되고 있는지를 분석하였다.

혼합형 침입차단시스템을 위한 통합 접근제어 규칙기술 언어 및 그래픽 사용자 인터페이스 구현 (Implementation of an Integrated Access Control Rule Script Language and Graphical User Interface for Hybrid Firewalls)

  • 박찬정
    • 정보보호학회논문지
    • /
    • 제9권1호
    • /
    • pp.57-70
    • /
    • 1999
  • 기존의 혼합형 침입차단시스템은 네트워크 계층에서의 패킷 필터링 기능과 응용 계층에서의 응용게이트웨이 기능을 함께 수행하기 때문에, 모든 데이터가 응용 프로그램 계층에서 처리되는 게이트웨이 방식 침입차단시스템에 비해 성능이 뛰어나고 게이트웨이 방식 침입차단시스템처럼 다양한 접근제어가 가능하면서도 사용자에게 투명성을 제공할 수 있다. 하지만, 네트워크 계층과 응용 계층에 대응되는 보안정책을 각각 설정하여 접근을 제어하기 때문에 관리자의 침입차단시스템 관리를 용이하게 하기 위해서 일관성있는 사용자 인터페이스 개발이 요구된다. 본 논문에서는 혼합형 침입차단시스템을 위한 그래픽 사용자 인터페이스를 구현하여 접근제어 및 로그 분석, 실시간 네트워크 트래픽 감시, 날짜별 트래픽에 대한 통계처리와 같은 관리기능을 제공한다. 이 때, 접근제어를 위해서 새로운 규칙기술 언어를 함께 제안하고, 이를 이용하여 사용자가 요구하는 다양한 형식의 접근제어 규칙을 생성하도록 한다.