• 제목/요약/키워드: 텍스트 매칭

검색결과 81건 처리시간 0.022초

자획 폭 변환에 기반한 도로표지 영상의 한글 텍스트 및 심볼 검출 (Detection of Hangul texts and symbols on road signs based on stroke width transform)

  • 박래정;조명석;윤준희;정규수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1318-1320
    • /
    • 2013
  • 본 논문은, 도로표지 영상의 자동 획득, 관련 정보의 검출/인식 및 온라인 갱신 기능을 갖는 차세대 도로표지 관리시스템에 요구되는, 도로표지 영상으로부터 방향지시 정보과 국문지명을 검출하는 방법을 제안한다. 자획 폭 변환을 사용하여 비텍스트 정보를 구분하고, 한글 템플릿 매칭을 사용하여 국문 지명의 영역을 검출한다. 제안한 방법은 실제 도로표지 영상에 대해서 98%의 방향지시 정보 검출율과 92%의 국문지명 검출율 성능을 보였다.

멀티-세션 오픈 도메인 지식기반 대화 수집 툴 (Multi-Session Open Domain Knowledge-based dialog collection Tool)

  • 김태용;김산;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.491-496
    • /
    • 2022
  • 최근 멀티-세션 데이터로 장기간 페르소나와 대화 일관성을 유지하며 인터넷에서 대화와 관련된 지식을 활용하는 대화모델 연구가 활발히 진행되고 있다. 하지만 이를 위한 한국어 멀티-세션 오픈 도메인 지식 기반 대화 데이터는 공개되지 않아 한국어 대화모델 연구에 어려움이 있다. 따라서 본 논문에서는 한국어 멀티-세션 오픈 도메인 지식 기반 데이터의 필요성을 시사하고, 데이터 수집을 위한 툴을 제안한다. 제안하는 수집 툴은 양질의 데이터 수집을 위해 작업자들이 사용하기 편하도록 UI/UX를 구성하였으며, 대화 생성 시 텍스트뿐만 아니라 정보가 밀집된 테이블도 대화에 활용할 지식으로 참조할 수 있도록 구현하였다. 제안하는 수집 툴은 웹 랜덤채팅 시스템에 기반을 두어 작업자가 여러 다른 작업자와 같은 확률로 매칭되게 구현되었으며, 일정 확률로 기존 대화로부터 대화를 시작하도록 함으로써 멀티-세션 대화 수집이 가능하도록 하였다.

  • PDF

스마트폰 환경의 혼합현실 기반 인터페이스를 사용한 영어단어 학습 게임 시스템 (English Word Learning System with Smartphone Augmented Reality Interface)

  • 김진국;이종원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.224-225
    • /
    • 2009
  • 본 논문에서는 스마트폰 환경의 혼합현실 기반 인터페이스를 사용한 영어단어 학습 게임 시스템을 제안한다. 제안한 시스템은 영어단어 학습 콘텐츠를 저작할 수 있는 저작도구와, 게임을 진행할 수 있게 해주는 스마트폰 인터페이스, 저작된 학습 콘텐츠를 실행하는 카드 매칭 게임 어플리케이션으로 구성되어있다. 이 시스템은 텍스트, 이미지, 비디오, 3D애니메이션 형식의 단어 카드를 제공하여 단순 이미지 형식을 사용한 방법보다 좀 더 구체적으로 단어를 묘사할 수 있다. 그리고 부모가 원활히 게임을 진행할 수 있도록 혼합현실 기반 인터페이스를 제공한다. 혼합현실 기반 인터페이스는 개인화된 정보를 부모에게 제공하여 부모가 사전 지식 없이 영어 단어 교육을 할 수 있도록 도움을 준다. 본 논문에서는 보급이 저조한 PDA와 UMPC대신, 최근 보급이 확산되고 있는 스마트폰에 혼합현실을 구현하여 인터페이스의 접근성을 높이고자 하였다.

경량 딥러닝과 지식베이스를 활용한 모바일 질환별 식품 추천 시스템 (Mobile Food Recommendation System for Patients U sing Light-weight Deep Learning and Knowledge Bases)

  • 현범수;김도현;이상근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.534-535
    • /
    • 2020
  • 본 논문에서는 딥러닝과 지식베이스를 융합하여 활용한 질환 인식 및 식품 추천 시스템을 제안한다. 제안하는 시스템은 온전히 모바일 디바이스 내에서 작동하는 시스템이다. 본 시스템은 압축된 딥러닝 모델을 이용해 사용자 대화 텍스트를 분석하여 사용자의 질환을 예측한다. 그 후, 지식베이스를 기반으로 해당 질환 관리에 도움이 되는 식품을 매칭하고 사용자에게 추천한다. 이는 사용자 친화적 헬스케어 애플리케이션으로써 체크리스트 작성 등 번거로운 작업 없이도 사용자에게 유용한 건강 정보를 제공할 수 있다.

비디오자료의 의미추출을 위한 영상초록의 효용성에 관한 실험적 연구 (An Experimental Study on the Effectiveness of Storyboard Surrogates in the Meanings Extraction of Digital Videos)

  • 김현희
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.53-72
    • /
    • 2007
  • 본 연구에서는 12개의 표본 비디오 집단과 14명의 피조사자들을 이용하여 영상 초록 및 전체 클립 보기를 통한 색인어 및 요약문 추출의 정확도를 측정해 보았다. 측정결과 첫째, 비디오 유형에 따라 정확도가 차이가 있는 것으로 나타났으며 이는 이미지에 주로 의존하여 정보를 표출하는 비디오의 경우 텍스트 초록만으로 의미 파악을 하기에는 한계가 있으며 텍스트 초록이 영상 초록과 함께 사용되었을 때 시너지 효과를 낼 수 있음을 보여주고 있다. 둘째, 영상초록의 색인어 및 요약문 정확도가 전체 클립의 정확도 보다 떨어지지만 절반치에 근접한 것으로 나타나 영상 초록이 비디오 의미 추출에 효율적으로 활용될 수 있음을 확인하였다. 또한 영상 초록의 색인어 정확도(0.45)가 요약문 정확도(0.40) 보다더 높게 나타나 영상초록을 통해서 색인어 추출 작업을 더 효율적으로 할 수 있음을 확인할 수 있었다. 이러한 실험결과에 기초하여 영상 초록이 색인어 또는 요약문 추출 작업에 활용될 수 있을 뿐만 아니라, 디지털도서관 환경에서 텍스트 초록과 같은 다른 메타데이터 요소들과 함께 사용된다면 이용자의 적합성 판정을 좀 더 용이하게 할 것이며, 더 나아가 영상 질의의 매칭 자료로도 이용될 수 있음을 제안하였다. 끝으로 영상 초록의 품질을 높이기 위한 키프레임 추출 알고리즘 및 키프레임 배열 모형 설계 등 후속 연구에 대해서 제언하였다.

시맨틱 웹을 위한 사진 관리 모델 (A Photo Management Model for Semantic Web)

  • 한정환;구용완
    • 한국산업정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.15-20
    • /
    • 2005
  • 웹의 출현이후 웹은 우리 일상의 정보검색 및 오프라인에서 이루어졌던 많은 영역들을 잠식해 가며 우리의 일상으로 다가왔다. 텍스트 기반의 검색에서 시작된 웹은 미디어의 발달에 따라 이미지${\cdot}$음악${\cdot}$영화 등의 멀티미디어 컨텐츠가 웹상에 범람하면서 기존의 텍스트 위주의 패턴매칭 검색방법이 아닌 해당 미디어에 최적화된 검색방법을 요구하게 되었다. 본 논문에서는 멀티미디어 자원에 대한 정보(메타데이터)를 RDF로 변환한 후 실제 멀티미디어 자원과 RDF로 변환된 해당 메타데이터를 각각의 서버에 분리${\cdot}$관리하여 그 자원들이 효율적으로 시맨틱 웹상에서 공유될 수 있도록 하는 모델을 제시하고 구현하였다. 제안된 모델은 모든 멀티미디어 자원에 적용될 수 있지만 설명과 구현의 편의를 위하여 디지털 사진을 예로 적용하였다.

  • PDF

교정사전과 신문기사 말뭉치를 이용한 한국어 철자 오류 교정 모델 (A Spelling Error Correction Model in Korean Using a Correction Dictionary and a Newspaper Corpus)

  • 이세희;김학수
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.427-434
    • /
    • 2009
  • 인터넷 및 모바일 환경의 빠른 발전과 함께 신조어나 줄임말과 같은 철자 오류들을 포함하는 텍스트들이 활발히 통용되고 있다. 이러한 철자 오류들은 텍스트의 가독성을 떨어뜨림으로써 자연어처리 응용들을 개발하는데 걸림돌이 된다. 이러한 문제를 해결하기 위해서 본 논문에서는 철자오류 교정사전과 신문기사 말뭉치를 이용한 철자 오류 교정 모델을 제안한다. 제안 모델은 구하기 쉬운 신문기사 말뭉치를 학습 말뭉치로 사용하기 때문에 데이터 구축비용이 크지 않다는 장점이 있다. 또한 교정사전 기반의 단순 매칭 방법을 사용하기 때문에 띄어쓰기 교정 시스템이나 형태소 분석기와 같은 별도의 외부 모듈이 필요 없다는 장점이 있다. 신문기사 말뭉치와 실제 휴대폰에서 수집한 문자 메시지 말뭉치를 이용한 실험 결과, 제안 모델은 다양한 평가 척도에서 비교적 높은 성능(오교정률 7.3%, F1-척도 97.3%, 위양성율 1.1%)을 보였다.

등급에 따른 웹 유해 문서 분류 기술 (A Distinction Technology for Harmful Web Documents by Rates)

  • 김영수;남택용;원동호
    • 정보처리학회논문지C
    • /
    • 제13C권7호
    • /
    • pp.859-864
    • /
    • 2006
  • 웹의 개방성은 사람들로 하여금 언제, 어디서든 손쉽게 유용한 정보를 획득할 수 있게끔 하였다. 하지만 인터넷은 유용한 정보의 손쉬운 활용이라는 순기능과 더불어 사회적으로 통제를 필요로 하는 유해한 정보 역시 인터넷을 이용하는 이용자들에게 무차별적으로 제공함으로써 역기능을 발생시키고 있다. 성인 컨텐츠 같은 정보들은 모든 사용자들, 특히 청소년들에게 악영향을 미칠 수 있다. 또한, 변태적인 성인 사이트들이 담고 있는 컨텐츠들은 성인들의 정신 건강에도 해를 미치게 된다. 한편, 인터넷은 전 세계적으로 연결된 개방망이므로 유해정보 제공자를 각국의 법적, 제도적 장치를 이용하여 규제하는데 한계가 있다. 또한, 유해 사이트, 유해성 스팸 메일, P2P 등 다양한 경로를 통해 유해 정보를 접할 수 있기 때문에, 어떤 시스템에 특화된 유해정보 분류기술을 개발하는 것은 바람직하지 않다. 따라서, 유해정보의 내용 자체에 기반하여 유해 여부를 자동으로 판별할 수 있는 유해정보 판별 핵심 기술의 연구 및 개발의 중요성이 점차 부각되고 있다. 이에 본 논문에서는 내용 기반 기술을 이용한 효율적인 유해 웹 문서 텍스트 판별 시스템을 제시한다.

랜드마크 항공 사진을 이용한 관광 경험과 색채 연관성 분석 (An Analysis of Tourism Experience and Color Relationships Using Landmark Air Photos)

  • 윤승식;도진우;강주영
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.51-57
    • /
    • 2018
  • 본 연구는 관광지를 선택할 때 중요한 관광 경험 중 시각적 요소에 해당하는 색상과 관광 경험 사이의 유효한 연관성을 찾는 것에 있다. 즉 관광지별로 대표되는 색상이 실제 관광지에 대한 경험과 관련이 있는지 찾아봄으로써, 시각적 요소 중 색채의 영향력에 대해 살펴보고자 하였다. 관광지 색상을 추출하기 위해 본 연구에서는 관광지별 랜드마크 항공 사진을 사용하였고, 기술표준원의 한국 표준색 색채 분석 도구인 KSCA를 이용하여 주요 배색을 추출하였다. 그리고 색상과 색상별 형용사 간의 관계를 매칭한 IRI image scale을 통해 관광지별 주요 색상에 대한 형용사를 추출하였다. 관광 경험은 색상을 추출한 관광지에 대한 Tripadvisor 리뷰를 분석하여 주요 키워드를 도출해 내었다. 항공 사진의 유효성 검증을 위해 Tripadvisor에서 제공하는 대표 전경 사진도 함께 분석에 활용되었다. 분석 결과 색상에서 추출된 형용사과 관광지별 리뷰 주요 키워드 간의 유효한 연관성은 찾을 수 없었는데, 이는 관광지 전체의 주요 색상은 관광지 세부 경험에 비해 중요한 요인이 되지 않고 있는 것으로 판단된다. 본 연구는 색상 분석 연구와 텍스트 마이닝을 결합한 새로운 연구 방향을 제시함으로써 추후 색상을 활용한 연구에 기여하고자 하였다.

P-RBACML : 프라이버시 강화형 역할기반접근통제 정책 언어 모델 (P-RBACML : Privacy Enhancing Role-Based Access Control Policy Language Model)

  • 이영록;박준형;노봉남;박해룡;전길수
    • 정보보호학회논문지
    • /
    • 제18권5호
    • /
    • pp.149-160
    • /
    • 2008
  • 개인 사용자들은 정보통신 서비스 이용을 위해 필요 이상의 개인정보를 공개하므로 프라이버시를 심각하게 침해당한다. 이러한 불완전한 개인정보관리 인프라를 보완하기 위해 P3P나 EPAL, XACML 같은 개인정보보호 플랫폼 기술이 개발되고 있지만, 이들은 개별주체들을 대상으로 보호자원에 대한 접근통제정책을 적용하므로 역할기반 접근통제를 원하는 기업이나 기관에는 적합하지 않다. 본 논문에서는 프라이버시를 강화한 역할기반 접근통제 정책을 표현하는 언어를 제안한다. 제안된 프라이버시 강화형 역할기반 접근통제 정책은 XACML을 변형한 것으로, XACML의 장점인 매칭과 조건 표현을 사용하며 프라이버시를 강화하기 위해 목적, 의무사항을 별도의 엘리먼트로 표현한다. 본 논문에서는 퍼미션 배정 정책에 관한 정책언어 모델을 제안하고, 개인정보보호 법률에 기초한 정책 시나리오와 도큐먼트 인스턴스를 제공한다. 또한 사용자의 요청컨텍스트와 그에 대한 응답컨텍스트도 제공한다.