• 제목/요약/키워드: 작성자분석

검색결과 77건 처리시간 0.024초

작성자 분석과 CNN을 적용한 소스 코드 작성자 식별 프레임워크 (The Identification Framework for source code author using Authorship Analysis and CNN)

  • 신건윤;김동욱;홍성삼;한명묵
    • 인터넷정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.33-41
    • /
    • 2018
  • 최근 인터넷 기술이 발전함에 따라 다양한 프로그램들이 만들어지고 있고 이에 따라 다양한 코드들이 많은 사람들을 통해 만들어진다. 이러한 측면을 이용하여 특정 작성자가 작성한 코드들 그대로 가져가 자신이 작성한 것처럼 보여주거나, 참고한 코드들에 대한 정확한 표기 없이 그대로 사용하여 이에 대한 보호가 점차 어려워지고 있다. 따라서 본 논문에서는 작성자 분석 이론과 합성곱 신경망 기반 자연어 처리 방법을 적용한 작성자 식별 프레임워크룰 제안한다. 작성자 분석 이론을 적용하여 소스 코드에서 작성자 식별에 적합한 특징들을 추출하고 이를 텍스트 마이닝에서 사용하고 있는 특징들과 결합하여 기계학습 기반의 작성자 식별을 수행한다. 그리고 합성곱 신경망 기반 자연어 처리 방법을 소스 코드에 적용하여 코드 작성자 분류를 수행한다. 본 논문에서는 작성자 분석이론과 합성곱 신경망을 적용한 작성자 식별 프레임워크를 통해 작성자를 식별하기 위해서는 작성자 식별만을 위한 특징들이 필요하다는 것과 합성곱 신경망 기반 자연어 처리 방법이 소스 코드등과 같은 특수한 체계를 갖추고 있는 언어에서도 적용이 가능하다. 실험 결과 작성자 분석 이론 기반 작성자 식별 정확도는 95.1%였으며 CNN을 적용한 결과 반복횟수가 90번 이상일 경우 98% 이상의 정확도를 보여줬다.

시스템다이내믹스 컨설팅에 있어서 연구자와 고객의 심리적 격차

  • 김동환
    • 한국시스템다이내믹스학회:학술대회논문집
    • /
    • 한국시스템다이내믹스학회 2005년도 춘계 학술대회 발표논문집
    • /
    • pp.63-74
    • /
    • 2005
  • 본 논문에서는 인과지도의 작성자와 독자 간의 심리적 격차에 관하여 분석하고자 한다. 먼저 기존에 연구되어 왔던 소산효과(dissipation effects)와 희석효과(dilution effects)는 인과지도를 작성하는 사람이 아니라 인과지도를 이해하는 사람에게 적용되는 심리적 경향이라는 점을 이 논문에서 지적한다. 소산 효과란 인과고리의 길이가 길어질수록 인과관계의 강도를 낮게 인식하는 심리적 경향을 의미한다. 희석효과는 여러 개의 인과관게가 존재할수록 특정 인과관계의 강도를 낮게 인식하는 심리적 경향을 의미한다. 이들 심리적 경향과는 달리 집중 효과(concentration effect)가 인과지도 작성자의 심리적 경향을 보다 잘 설명하는 것으로 실험 결과 분석되었다. 집중 효과란 주의를 집중하는 영역에 대하여 많은 인과관계를 생각하고, 인과관계의 강도 역시 강하게 생각하는 심리적 경향을 의미한다. 인과지도의 작성자 즉 시스템 컨설팅을 담당하는 사람들에게는 소산효과나 희석효과 보다 집중효과가 더 강하게 작용한다는 것이다. 이러한 심리적 비대칭성이 시스템 다이내믹스 연구자와 그의 고객 간의 의사소통 문제를 야기 시킨다는 점을 본 논문에서 지적한다.

  • PDF

오피니언 마이닝을 이용한 친구 추천 시스템 (Friend Recommendation System Using Opinion Mining)

  • 황수진;윤재열;김이준;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1188-1190
    • /
    • 2011
  • 오피니언 마이닝은 웹에 있는 문서를 분석하여 작성자의 의견을 요약된 형태로 보여주는 기술이다. 오피니언 마이닝을 이용해 문서 작성자의 주관적 의견을 알 수 있고 이를 통해 작성자의 성향이나 관심사와 같은 정보를 얻을 수 있다. 많은 네티즌들은 소셜 네트워크 서비스를 통해 자신의 의견이 담긴 글을 타인과 공유 하며 네트워크상의 인맥을 넓혀 나간다. 오피니언 마이닝을 통해 개인이 작성한 글들을 분석하여 관심사를 파악하고 비슷한 관심사를 가진 친구를 추천하는 친구 추천 시스템을 제안한다.

오피니언 마이닝에서의 텍스트 신뢰도 측정 방법 (The way to measure trust ratio of text in Opinion Mining)

  • 김이준;임지연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.135-138
    • /
    • 2011
  • 정보화 시대에 정보력 경쟁과 확보는 오늘날 생존과 직결될 수 있는 가장 중요한 요소가 되었다. 이런 급속히 발전하는 온라인상에서, 정보를 공유하는 사람들은 양질의 정보를 공유할 의무가 있다. 또한, 많은 사람들이 자신의 생각에 확신을 가지기 위해 웹상의 다른 사람들의 정보를 참조하고 결정하는데 있어서 도움을 구하는 것이 현실이다. 이렇듯 웹상에서 넘쳐나는 수많은 정보와 의견들을 전부 신뢰할 수 없기에, 작성자의 신뢰도를 어느 정도 수치화 한다면 특정 작성자들의 의도적인 의견 조작에 의한 피해들을 사전에 방지할 수 있을 것이다. 본 논문에서는 특정 작성자의 글을 오피니언 마이닝하여, 특정 카테고리 별로 분석하여 신뢰도 점수를 부여하는 방법을 제안 하고자 한다.

채팅 메신저 사용자 검증을 위한 그래프 랜덤 워크 분석 (Graph Random Walk Analysis for Chat Messenger User Verification)

  • 이다영;조환규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 2021
  • 메신저 사용의 증가와 함께 관련 범죄와 사고가 증가하고 있어 메시지 사용자 검증의 필요성이 대두되고 있다. 본 연구에서는 그래프 기반의 인스턴트 메세지 분석 모델을 제안하여 채팅 사용자를 검증하고자 한다. 사용자 검증은 주어진 두 개의 텍스트의 작성자가 같은지 여부를 판단하는 문제다. 제안 모델에서는 사용자의 이전 대화를 토대로 n-gram 전이 그래프를 구축하고, 작성자를 알 수 없는 메세지를 이용해 전이 그래프를 순회한 랜덤워크의 특성을 추출한다. 사용자의 과거 채팅 습관과 미지의 텍스트에 나타난 특징 사이의 관계를 분석한 모델은 10,000개의 채팅 대화에서 86%의 정확도, 정밀도, 재현율로 사용자를 검증할 수 있었다. 전통적인 통계 기반 모델들이 명시적 feature를 정의하고, 방대한 데이터를 이용해 통계 수치로 접근하는데 반해, 제안 모델은 그래프 기반의 문제로 치환함으로써 제한된 데이터 분량에도 안정적인 성능을 내는 자동화된 분석 기법을 제안했다.

  • PDF

엔트로피 지도 CRF를 이용한 한국어 어절 구문태그 예측 (Eojeol Syntactic Tag Prediction of Korean Text using Entropy Guided CRF)

  • 오진영;차정원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.395-399
    • /
    • 2009
  • 본 연구에서는 의사결정나무와 Conditional Random Fields(CRFs)를 이용하여 한국어 어절 구문태그를 예측하는 시스템에 대해서 설명한다. 기계학습에서 자질의 선택은 작성자의 직관에 의해서 주로 이루어지는데 이는 작성자의 지식에 의존한다. 본 연구에서는 의사결정나무를 사용하여 보다 체계적으로 조합이 이루어지도록 하였다. 또한 오류 분석을 통하여 최적의 자질이 무엇인지를 파악하여 최고의 성능을 보이도록 하였다. 실험을 통하여 본 논문에서 제안한 방법이 성능향상에 도움이 된다는 것을 확인할 수 있어 앞으로 구문 분석에 많은 도움이 될 것이라고 확신한다.

2단계 구문분석을 이용한 구문분석 말뭉치 구축도구 (Tree Tagging Tool using Two-phrase Parsing)

  • 김혜겸;박경미;윤여찬;임해창;박소영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.151-158
    • /
    • 2005
  • 본 논문에서는 2단계 구문분석을 통한 구문분석 말뭉치 구축도구를 제안한다. 제안하는 방법은 대량의 구문분석 말뭉치를 수동으로 구축할 때 요구되는 작성자의 수작업을 줄이는 것을 목적으로 한다. 도구는 입력 문장을 문장 분할기준에 따라 분할하는 문장 분할 단계, 각 부분에 대해 자동 구문분석을 수행하는 부분 구문구조 생성 단계, 각 부분 구문구조를 통합하여 완전한 구문구조를 얻는 부분 통합 단계로 이루어져 있다. 자동 구문분석은 자질기반 한국어 구문분석모델을 이용하였고 문장을 부분으로 분할할 때는 문장 분할기준을 말뭉치에서 자동추출 하고 간단한 검증을 거쳐 적용하는 방법을 택하였다. 구문분석 말뭉치 구축의 각 단계에서 자동 구문 분석기가 출력한 결과를 작성자가 취소, 재구축 가능하게 하였다.

  • PDF

온라인에서의 레스토랑 구전정보 작성자와 구전평가 방향에 따른 레스토랑 방문의도와 정보 신뢰도 차이 연구 (A Study on the Differences in Restaurant Visit Intention and Information Credibility Based on e-WOM for Restaurants and Directions of Replies)

  • 송민경;윤혜현
    • 한국조리학회지
    • /
    • 제19권2호
    • /
    • pp.190-202
    • /
    • 2013
  • 인터넷이 발달하고 대중화됨에 따라 소비자들은 지출에 앞서 온라인 내 타인의 정보를 반영하고 활용한다. 본 연구에서는 사회과학 실험을 통해, 레스토랑 방문 계획을 가진 소비자들이 인터넷에서 1) 정보의 작성자가 누구인지에 따라(일반 익명의 소비자 또는 전문가), 2) 정보의 방향성에 따라(긍정적인 것 또는 부정적인 것) 레스토랑 방문의도와 정보의 신뢰도에 차이가 있는지를 알아보았다. 연구목적에 부합되도록 4개의 시나리오를 작성하였다. SPSS WIN(v.16.0)을 이용하여 빈도분석과 t-test등으로 분석하였다. 2(긍정적 정보vs. 부정적 정보)*2(소비자 작성 정보 vs. 전문가 작성 정보) 실험디자인을 통해 본 연구에서는 정보 작성자에 따른 레스토랑 방문의도(p<.001)와 정보의 신뢰정도(p<.001)에 유의한 차이가 있음을 보였다. 또한 각각 긍정적 정보와 부정적 정보를 읽은 실험참가자 사이에 레스토랑 방문의도(p<.001)와 정보의 신뢰도(p<.01)에는 유의한 차이가 있음을 확인하였다. 그 밖의 연구 결과와 한계점, 후속 연구의 방향에 대해서도 논의하였다.

  • PDF

시소러스 작성을 위한 개념 획득 도구 (A Concept Acquisition Tool for Thesaurus Construction)

  • 김명철;이운재;최기선;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.39-49
    • /
    • 1992
  • 시소러스를 작성하기 위해 시소러스 작성자가 고려래야 하는 문제는 단어간의 개념 관계이다. 단어간의 관개는 계층구조에 정의된 개념을 기반으로 분석하여 하향식으로 시소러스를 작성하는 것이 일반적이다. 이러한 방식은 작성자에 의존적이므로 시소러스의 정확도를 보장할 수 없고 주관적인 성향을 가진다. 그래서 Corpus에서 자동으로 개념 및 개념 관계를 추출하는 상향식 방법들이 다양하게 시도되고 있다. 본 논문에서는 시소러스 작성을 위한 자동 개념 획득 도구를 설계, 구현하였다. Mutual Information이라는 방법을 이용하여 공기 정보(Collocation)를 정량화하고 이를 통하여 단어간의 개념관계의 크기를 측정한 후 개념 관계의 크기(MI 값)가 큰 값을 선택하여 개념 화일을 작성한다. 실험 결과로 얻은 개념 화일은 두 개념간의 밀접도를 나타내므로 시소러스 작성에 매우 유용하다.

  • PDF

우리나라 그림책 서평의 변천과정 분석 (An Analysis of the Development of Picture Book Reviews in Korea)

  • 공정자;심원식
    • 한국도서관정보학회지
    • /
    • 제45권4호
    • /
    • pp.165-184
    • /
    • 2014
  • 본 연구는 국내에서 그림책의 서평의 변천과정을 공공도서관의 발달과 그림책 서평을 수록하고 있는 잡지의 등장시기, 서평의 발행주체와 주요 작성자를 중심으로 분석하였다. 시기별로 1980년대는 성인도서 위주의 전문서평지가 발간되기 시작하며, 1990년대는 어린이도서연구회와 같은 시민단체의 활동이 활발하였다. 2000년대 전반기는 독서관련 단체가 계속 활발히 활동하며 신문사의 북 섹션과 출판사 발행 문학잡지 내에 그림책 서평을 활발히 발간하기 시작하였다. 2000년대 중반 이후부터 최근까지는 공공도서관이 많이 건립되었으며 사서들이 서평 작성자로 등장한 것이 큰 특징이다.