• 제목/요약/키워드: 단어 정렬

검색결과 56건 처리시간 0.03초

단어 유사도를 기반으로 한 맛집 블로그 포스트 클러스터링 시스템 (Clustering System of Restaurant Review in Blog based on Word Similarity)

  • 조경은;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.993-996
    • /
    • 2015
  • 인터넷 블로그를 이용한 맛집 마케팅은 외식 산업에서 상당한 영향력을 발휘하고 있다. 사람들은 블로그를 이용해 많은 맛집 리뷰를 작성 및 검색하고 있다. 그런데 사람들이 맛집 리뷰를 검색하면, 검색 엔진에서는 검색어에 대한 정확도 및 시간순으로 검색 결과를 정렬해 주기 때문에 같은 식당에 대한 포스트들이 분산되어 검색된다. 따라서 사람들은 수많은 맛집 리뷰가 섞여있는 검색 결과를 보고 그중 한 식당을 선택하는 것에 어려움을 느낄 수 있다. 이때, 같은 식당에 대한 리뷰를 모아서 보여준다면 어떤 식당에 대한 리뷰가 존재하는지 일목요연하게 볼 수 있으며, 한 식당에 대한 다양한 의견을 참고하여 가고자 하는 식당을 선택하는데 도움이 된다. 따라서 본 논문에서는 블로그의 맛집 포스트를 클러스터링 하는 시스템을 제안하였다. 시스템을 통해 생성된 클러스터의 평가 결과, 정확률, 난수 색인, 순수도는 90% 이상의 높은 값을 보였다.

반 전역 정렬을 이용한 온라인 게임 변형 욕설 필터링 시스템 (The Online Game Coined Profanity Filtering System by using Semi-Global Alignment)

  • 윤태진;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.113-120
    • /
    • 2009
  • 온라인 게임에서의 언어폭력 문제는 매우 심각하지만 그에 대한 효과적인 정책이나 기술적인 방법은 부족한 상황이다. 온라인 게임 서비스 업체에서는 금칙어 리스트를 작성하여 Swear Filter를 이용한 고정된 형식의 문자열 검색 방식을 통해 문제를 해결하려고 하고 있으나 사용자들은 다양한 방법으로 욕설을 조합 또는 변형시켜 기존의 필터링을 회피하고 있다. 특히 한글은 욕설의 변형이 매우 쉬운 특성을 가지고 있다. 본 논문에는 한글에 기초한 변형 욕설을 효율적으로 탐색하여 걸러내는 알고리즘을 제시한다. 이 알고리즘의 주된 특징은 변형 욕설의 표준형 변환과 자소단위의 반 전체 정렬(semi-global alignment), 이다. 실험 결과 저자들이 다양한 인터넷 게임 환경에서 직접 수집한 다종의 욕설 단어들에 대하여 약 90%의 우수한 필터링 성능을 보였다.

반도체 광스위치 모듈의 제작 및 특성연구 (Fabrication of semiconductor optical switch module using laser welding technique)

  • 강승구
    • 한국광학회지
    • /
    • 제10권1호
    • /
    • pp.73-79
    • /
    • 1999
  • 1$\times$2, 1$\times$4 및 4$\times$4 LD-gate형 반도체 광스위치 모듈을 제작하였다. 스위치 소자와 광섬유와의 광결합을 위해서 테이퍼드 광섬유를 어레어로 제작하여 사용하였으며 30핀 버터플라이형 패키지로 완성하였다. 광 부푼 정렬 및 고정에서는 레이저 용접법 및 햄머링 공정을 이용하여 최초의 광정렬 값에서 평균 82%까지 복원하였다. 완성된 모듈에 대한 평가를 위해 전송 실험을 수행하였는데 1$\times$2 스위치 모듈이 삽입되었을 때 223-1의 단어길이를 갖는2.5Gbps 광신호에 대해서 전송패널티가 약0.5dB~2dB로 나타났으며, 광섬유의 분산특성에 의하여 발생하는 전송 패널티에 대해서는 50km 및 90km 광섬유에 대해서 각각 0.6dB 및 0.7dB의 작은 패널티가 발생하였다. 1$\times$4 및 4$\times$4 스위치 모듈을 이용한 전송특성 평가에서도 모두 -30dB 이하의 수신감도를 갖는 우수한 결과를 보였다.

  • PDF

영-한 병렬 코퍼스로부터 외래어 표기 사전의 자동 구축 (Automatic Construction of Foreign Word Transliteration Dictionary from English-Korean Parallel Corpus)

  • 이재성
    • 컴퓨터교육학회논문지
    • /
    • 제6권2호
    • /
    • pp.9-21
    • /
    • 2003
  • 본 논문에서는 한국어 번역문과 영어 원문으로 구성된 병렬 코퍼스로부터 자동으로 외래어 표기 사전을 구축하는 시스템을 제안한다. 구축 시스템은 첫 단계로 한국어 문서에서 명사를 추출하고, 두 번째 단계에서 추출된 명사 중 언어 모델에 근거하여 외래어만을 추출한 후, 마지막 세 번째 단계에서 확률적 정렬 방법을 이용하여 외래어에 대응되는 영어를 추출한다. 특히, 외래어는 한국어 어미나 조사가 붙어서 같이 쓰이기 때문에, 한국어 어절 내에서 정확하게 외래어 부분만을 분리하기 위해, 병렬 코퍼스 내에 존재하는 대응 영어 단어 정보를 활용하였다. 또, 문자체계가 다른 두 단어를 같은 문자로 변환하지 않고 직접 음운 유사도를 비교할 수 있도록 했다. 실험 결과, 성능은 전처리 단계인 한국어 미등록어 및 외래어 추정에 영향을 많이 받았고, 수작업으로 전처리를 한 모델 중 가장 성능이 높은 것은 재현률 85.4%, 정확률 91.0%를 보였고, 전 과정을 자동으로 한 모델중에서는 재현률 68.3%, 정확률 89.2%를 보였다.

  • PDF

추천 소프트 키보드 MissLess의 성능 평가 (Performance Evaluation of MissLess Soft Keyboard with Recommendation)

  • 황기태;김태완;조혜경
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.187-195
    • /
    • 2014
  • 본 논문은 선행 연구에서 개발한 MissLess 키보드의 성능을 평가한다. MissLess 키보드는 모바일 단말기 내의 사전에 저장되는 모든 어휘에 해시 코드 값을 할당한다. 그리고, 사용자가 입력한 어휘와 일정 범위의 해시 코드를 가진 어휘를 골라내는 해시필터링, 골라낸 어휘와 입력된 어휘의 철자 유사성을 실시간으로 비교하여 유사 단어를 추려내는 철자 유사성 기반 정렬, 그리고 마지막으로 사용자의 사용 빈도가 놓은 어휘를 우선적으로 골라내는 사용자 패턴 기반 추천의 3 단계를 거쳐 어휘를 추천한다. 본 논문은 추천 알고리즘의 각 단계별로 성능 요소를 분석하고, 이들 요소가 미치는 추천 성능의 영향을 평가하고 평가된 결과를 보인다.

고속도로 VMS Message Set 연구 및 이용자 선호도 평가 (A Study on Message Set of VMS on Express way and Evaluation of Driver's Preference)

  • 김남선;지동목;오영태;이환필;김상복
    • 한국ITS학회 논문지
    • /
    • 제8권4호
    • /
    • pp.1-13
    • /
    • 2009
  • 도로전광표지(VMS;Variable Message Sign)는 지능형교통시스템의 세부시스템중 하나로 도로이용자에게 실시간으로 교통정보를 제공하여 교통흐름을 원활하게 하는 기능을 가지고 있다. 그러나 현재 고속도로 구간의 VMS운영현황을 조사한 결과, 현시운영측면에서 메시지판독횟수가 정의되지 않아 적정현시운영에 어려움이 있으며, 정보제공측면에서 VMS 설치구간의 특성고려가 미흡하여 운전자의 혼란을 유발시키는 문제점이 드러났다. 세부적으로 문안표출시 글자체(Font), 표출전환방식, 정렬방식, 표출메시지 구성의 통일성이 결여되어 있고 불필요한 단어사용과 통일되지 않은 동일의미의 여러 용어를 사용하는 등 효과적인 정보전달체계에 개선이 필요한 것으로 분석되었다. 이에 본 연구는 VMS 운영관련지침 및 연구분석결과를 토대로 VMS 설치위치별 요구기능과 적정현시수의 정의 등의 효율적인 표출방안을 수립하였다. 세부표출방안으로 제공글자체, 메시지 전환방식, 정렬방식을 통일하였고, 운전자의 직관적인 메시지 판독이 가능하도록 상황별로 표출색상을 정의하였다. 본 연구에서 제시한 개선안의 평가를 위해 일반운전자들을 대상으로 기존안과 개선안의 선호도평가와 통계분석을 실시하였다.

  • PDF

『노걸대』 분석을 통해서 바라본 우리 반도의 외국어 교육 (Foreign Language Education of Korean Peninsula: Insights from Nogeldae)

  • 김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제17권6호
    • /
    • pp.408-414
    • /
    • 2017
  • 본 연구는 고려말에 저자미상의 실용적인 목적으로 만들어진 외국어 교재 "노걸대"에 대하여 어떻게 고려말부터 조선 500년 동안 지속적으로 외국어 교재로 사용될 수 있었는지 외국어 교재로서 그 지속성의 가치는 어디에 있는지를 알아보고자 하는데 있다. 이를 위해서 "노걸대"에 있는 대화문 구성된 의사소통 상황별로 정광의 "노걸대" 역주본에 나와 있는 106편의 대화를 만남(12편), 숙박(17편), 대도행(21편), 대도 생활(34편), 귀국(11편)으로 구분하여 평균문장길이, 어휘길이, 타입-토큰 비율, 본동사 앞 단어 수, 명사구 평균 수식어수 항목 측정치를 활용하여 외국어 교재로서의 계열성을 파악하고자 한다. "노걸대"는 제시된각 의사소통기능에서 일부 명사구 내의 계열성이 무시된 경우를 제외하면 전체적으로 복잡도의 계열성을 확인할 수 있었다. 문장 길이, 문장의 복잡도 계열성은 전체적으로 확인되었다. 어휘의 다양성은 계열성이 제대로 구성되었다고 볼 수는 없으나 어휘의 반복율이 높은 것은 기본적인 어휘의 사용이 많이 이루어졌다는 것을 의미한다.

중간언어 문맥벡터의 정제를 통한 이중언어 사전 구축의 성능개선 (Enhancing Performance of Bilingual Lexicon Extraction through Refinement of Pivot-Context Vectors)

  • 권홍석;서형원;김재훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권7호
    • /
    • pp.492-500
    • /
    • 2014
  • 본 논문은 중간언어 기반 이중언어 사전 구축 방법에서 문맥벡터의 정제 방법을 제안한다. 중간언어 기반 이중언어 사전 구축 방법은 두 언어 간의 사전이나 병렬말뭉치 등 언어 자원이 부족한 언어쌍에 매우 효과적인 방법이다. 본 논문은 두 가지 정제 방법을 통해서 성능을 개선한다. 첫 번째 방법은 양방향 번역확률을 통하여 문맥벡터를 정제하였고 두 번째 방법은 품사 정보를 이용하여 문맥벡터를 정제하였다. 본 논문은 두 개의 서로 다른 언어 쌍으로 한국어-스페인어 그리고 한국어-프랑스어 양방향에 대해서 각각 이중언어 사전을 추출하는 실험을 하였다. 높은 빈도수를 가지는 어휘에 대한 번역 정확도는 최상위에서 최소 48.5%를, 상위 20에서 최대 88.5%의 정확도를 얻었고, 낮은 빈도수를 가지는 어휘에 대한 번역 정확도는 최상위에서 최소 26.5%를, 상위 20에서 최대 66.5%의 성능을 보였다.

한영 혼용문에서 괄호 안 대역어구의 자동 인식 (Automatic Recognition of Translation Phrases Enclosed with Parenthesis in Korean-English Mixed Documents)

  • 이재성;서영훈
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.445-452
    • /
    • 2002
  • 한영 혼용문에서 번역된 전문용어 등을 사용할 때, 이해를 돕기 위해 그 뒤의 괄호 안에 원어 풀이를 함께 쓰는 경우가 많다. 본 논문에서는 괄호가 사용된 구가 대역어구 관계인지를 판단하고, 어느 범위까지 대역어구인지를 기본사전을 이용하여 확률적으로 계산하고 인식하는 방법을 제시한다. 특히, 사전에 표제어로서 혹은 대역어로서 존재하지 않는 단어들을 처리하기 위해 음운유사도 일치, 대역어 부분일치의 방법과 복합어 처리를 위해 부분일치 방법을 새로 제안하였다. 각 방법들을 단계별로 실험하여 0.4F값$(\alpha$를 0.4로 설정한 F값)으로 측정한 결과, 기본 실험 방법인 사전 대역어 완전일치방법의 경우 23.8%인데 비해, 대역어 부분일치와 음운유사도 일치를 흔합한 방법이 75.9%, 복합어 처리를 추가한 방법이 77.3%의 값을 보여 성능이 최고 3.25배 향상되었다.

고서목록 데이터베이스의 검색 인터페이스에 관한 연구 - 검색 기능을 중심으로 - (A Study on the Search Interface of Archival Databases in Korea: With a Focus on Search Functions)

  • 윤정옥
    • 한국도서관정보학회지
    • /
    • 제42권2호
    • /
    • pp.257-276
    • /
    • 2011
  • 이 연구의 목적은 국립중앙도서관의 '한국고전적종합목록시스템'과 국사편찬위원회의 '한국역사정보통합시스템' 이라는 두 고서 관련 정보 시스템의 검색 인터페이스 기능과 특성을 비교 및 분석하는 것이다. Breeding의 OPAC 표준 기능성 체크리스트를 사용하여 검색 관련 열한 개 항목을 네 개 범주로 나누어 분석한 결과, 키워드 검색, 질의에서 불리안 연산자 사용, 시대순 결과 정렬, 초기 단어 재입력 않고 탐색 수정 가능, 결과 집합 내 검색, 및 개별 도서관이나 장소로 결과 제한 가능 등 여섯 개 기능성은 두 시스템 모두 제공하였으나, 저자, 서명, 주제 브라우즈와 현재 세션의 검색 이력 보기와 불러오기는 두 시스템 다 제공하지 않았다. 이들은 OPAC의 표준 기능성 및 차세대 OPAC 기능성 반영, 이용자 요구와 정보추구행태의 심층적 분석, 주제 접근성 강화 등이 시급한 것으로 나타났다.