• Title/Summary/Keyword: 자동정보 추출

Search Result 1,996, Processing Time 0.032 seconds

Automatic Construction of Alternative Word Candidates to Improve Patent Information Search Quality (특허 정보 검색 품질 향상을 위한 대체어 후보 자동 생성 방법)

  • Baik, Jong-Bum;Kim, Seong-Min;Lee, Soo-Won
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.10
    • /
    • pp.861-873
    • /
    • 2009
  • There are many reasons that fail to get appropriate information in information retrieval. Allomorph is one of the reasons for search failure due to keyword mismatch. This research proposes a method to construct alternative word candidates automatically in order to minimize search failure due to keyword mismatch. Assuming that two words have similar meaning if they have similar co-occurrence words, the proposed method uses the concept of concentration, association word set, cosine similarity between association word sets and a filtering technique using confidence. Performance of the proposed method is evaluated using a manually extracted alternative list. Evaluation results show that the proposed method outperforms the context window overlapping in precision and recall.

An Automatic Summarization System Based On a Probabilistic Model Using Document Structure Information (문서 구조 정보를 이용한 확률 모델 기반 자동요약 시스템)

  • Jang, Dong-Hyun;Myaeng, Sung-Hyon
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.15-22
    • /
    • 1997
  • 인터넷과 정보 서비스 기술의 발달로 일반 대중에게 제공되는 정보의 양은 기하급수적으로 증가하고 있는 추세지만 사용자가 원하는 정보를 얻기는 더욱 어려워지고 있으며, 필요한 정보를 찾은 경우에도 그 양이 많기 때문에 전체적인 내용을 파악하는 데 많은 시간을 소비하게 된다. 이러한 문제를 해결하고자 본 연구에서는 통계적 모델을 사용하여 문서로부터 문장을 추출한 후 요약문을 작성하여 사용자에게 제시하는 시스템을 개발하였다. 문서 요약 시스템의 구축을 위하여 사용된 방법은 문서 집합으로부터 중요 문장을 추출한 후 이로부터 요약문에 나타날 수 있는 특성(feature)과 중요 단어를 학습하여 학습된 내용을 이용하여 요약문을 하는 방법이다. 시스템 개발 및 평가를 위해 사용된 문서는 정보 과학 분야의 논문 모음이며 이를 학습 데이터와 실험 데이터로 구분한 후 학습 데이터로부터 필요한 정보를 얻고 실험 데이터로 평가하였다.

  • PDF

XML based Real-Time Semantic Information Oriented Service System Design for Intelligent Business (지능적 비즈니스를 위한 XML 기반 실시간 의미정보지향 서비스 시스템 설계)

  • Hong, Seong-Yong;Jin, Hye-Jin
    • Annual Conference of KIPS
    • /
    • 2007.05a
    • /
    • pp.6-9
    • /
    • 2007
  • 최근 e-비즈니스나 인터넷 쇼핑몰 사이트에서는 많은 양의 상품 이미지 정보와 컨텐츠를 취급하고 있으며, 이로 인하여 효과적인 실시간 의미정보 검색의 필요성이 대두되고 있다. 본 논문에서는 XML 기술과 퍼지기술을 이용하여 웹상의 상품 정보를 의미적으로 검색할 수 있는 시스템에 대해 기술한다. 본 논문에서 제시한 시스템은 상품 이미지 XML 문서를 이용하여 메타데이타를 추출하고, 추출된 메타데이타를 의미정보로 자동 변환하여 실시간 서비스할 수 있는 방법을 제안한다. 따라서, 인터넷 비즈니스를 좀 더 지능화 할 수 있는 시맨틱 웹 환경이나 Web2.0 을 구현하는데 기여할 수 있을 것이라 기대한다. 또한 사용자의 입장에서는 실시간 의미정보를 서비스 받을 수 있는 장점을 가지게 될 것이다.

Personalized Contents using the Tags of the Social Bookmarking Service (소셜 북마킹 서비스의 태그를 이용한 개인화 콘텐츠)

  • Han, Ju-Hyeun;Jung, Moon-Ryul
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.267-272
    • /
    • 2009
  • 웹 2.0 이라 불리는 현 웹의 패러다임은 개방, 공유, 참여로 압축하여 말할 수 있다. 이 속에서는 사용자의 참여와 공유로 콘텐츠가 생산 또는 재생산된다. 이러한 콘텐츠는 사용자의 관심을 반영하기 때문에 사용자가 어떠한 콘텐츠를 만들어 냈는지, 수집했는지 등을 분석하면 사용자의 관심 범주를 추출할 수 있다. 본 논문에서는 사용자가 소셜 북마킹 서비스를 이용하며 생성한 태그를 바탕으로 사용자의 관심 범주를 추출하여 이를 통해 개인화 콘텐츠 제공 서비스를 제안한다. 우선, 웹 서비스에서 제공하는 피드를 이용하여 사용자가 생성한 태그 중 가장 많이 쓰인 10개의 태그와 그것들과 관련 있는 태그들만 모아서 관심 범주을 추출하기 위한 태그 집합을 구성한다. 구성된 태그 집합을 바탕으로 피어슨 상관 계수를 통해 태그 간 동시 사용률을 조사한다. 이후 사용자 흥미에 부합하는 콘텐츠를 검색하기 위해 조사된 동시 사용률을 바탕으로 검색 키워드 그룹을 추출한다. 이렇게 만들어진 키워드 그룹들은 사용자의 평소 관심사와 관련된 콘텐츠를 검색하는데 사용되며, 이를 통해 사용자의 관심 있는 내용의 콘텐츠를 사용자의 특별한 검색 절차 없이 제공받는다. 이러한 방식을 통해 사용자가 원하는 정보를 입력하는 절차 없이도 웹에 축적된 사용자의 정보를 사용하여 자동으로 개인화된 콘텐츠를 제공할 수 있을 것으로 기대 된다.

  • PDF

Detection of Flaws in Air Deck using Non-Destructive Testing (비파괴 검사를 이용한 항공 갑판의 결함 검출)

  • Huh, Eui-Jung;Kang, Jin-Hwa;Kim, Kwang-Beak
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2010.10a
    • /
    • pp.193-195
    • /
    • 2010
  • 본 논문에서는 비파괴 검사를 통하여 얻어진 항공 갑판 영상에서, 조직의 이상이나 결함의 정도를 자동으로 검출하는 방법을 제안한다. 비파괴 검사를 통하여 얻어진 항공 갑판 영상에서 감마상관 변환과 $7{\times}7$ 소벨 마스크와 $13{\times}13$ 소벨 마스크를 각각 적용하여 윤곽선을 추출한다. 추출된 윤곽선 영역을 평활화와 평균 이진화 기법을 적용하여 영상을 보정한다. 보정된 영상에서 침식 연산과 팽창 연산을 이용하여 잡음을 제거한 후, 라벨링 기법을 적용하여 항공 갑판의 결함 영역을 추출한다. 본 논문에서 제안한 방법을 다양한 항공 갑판 영상을 대상으로 실험한 결과, 기존의 방법보다 항공 갑판에서 결함을 추출하는데 효과적인 것을 확인하였다.

  • PDF

Fingerprint Image Enhancement based on Genetic Algorithms for Singularity Extraction (특이점 추출을 위한 유전자 알고리즘 기반 지문영상 개선)

  • Cho Ung-Keun;Hong Jin-Hyuk;Cho Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.847-849
    • /
    • 2005
  • 지문의 특이점은 인식이나 분류를 수행할 때 중요한 특징이다. 특이점 추출은 영상의 품질에 민감하기 때문에, 정확한 추출을 위해 영상의 품질을 향상시키는 것이 필요하다. 다양한 이미지 필터를 적절히 적용하면 개별필터를 적용하는 것에 비해 더 높은 품질을 얻을 수 있지만, 영상 필터가 다양할수록 성능이 좋은 필터 조합을 찾는 것이 어렵다. 본 논문에서는 유전자 알고리즘을 이용하여 특이점 추출율이 좋은 필터 조합을 찾는 방법을 제안한다. 진화에 의해 성능이 좋은 필터 조합을 자동으로 찾아주며, 전문가의 지식이 필요하지 않기 때문에 영상 개선의 여러 분야에 적용될 수 있다. 제안하는 방법을 NIST DB 4에 적용한 결과 기존의 영상 개선 방법보다 높은 성능을 획득하였다.

  • PDF

Segmentation of lung and lung lobes in EBT medical images (EBT 의료 영상에서 폐 영역의 추출 및 폐엽의 분할)

  • Kim, Young-Hee;Lee, Sung-Kee
    • Annual Conference of KIPS
    • /
    • 2000.10b
    • /
    • pp.895-898
    • /
    • 2000
  • 의료 영상에서 폐 영역의 정확한 추출과 폐엽의 분할은 폐 기능의 측정 및 폐 질환의 진단을 위하여 매우 중요하다. 본 논문에서는 EBT 흉부 영상에서 자동으로 폐 영역을 추출하고 폐 영역을 폐엽 단위로 분할하는 방법을 제안한다. 본 논문에서는 히스토그램 분석과 형태학적 연산자를 이용하여 폐 영역을 추출하고 adaptive filter를 이용한 에지 연산과 폐엽 경계(pulmonary fissure)에 대한 의학적 지식을 바탕으로 폐엽을 분할하였다. 본 방법을 여러 종류의 EBT 폐 영상에 적용하여 실험한 결과 95%이상의 정확도를 보였다.

  • PDF

Face Data Clustering Method for Face Recognition Using Self Organizing Feature Map (자기 조직화 지도 모형을 이용한 인종별 얼굴 영상 군집화 기법)

  • 권혜련;고병철;변혜란;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.577-579
    • /
    • 2003
  • 본 논문에서는 생체인식 분야 중 얼굴인식의 검색 정확성 향상 및 검색 시간을 단축하기 위한 단계로 인종별 얼굴영상 데이터베이스에 대한 군집화 기법을 연구하였다. 우선, 일반적으로 얼굴 및 이미지 검색에 사용되는 다양한 특징을 추출하고, 추출한 다차원의 특징 데이터들로부터 다 인종 얼굴 데이터를 유사한 인종별로 정확하게 군집화 하기 위해 최적의 특징벡터를 자동으로 선택 할 수 있는 방법을 제안하였다. 군집결과 분석을 위해 자기 조직화 지도 모형을 이용하였는데, 이는 2차원 분석 및 가시화에 유용하며, 학습 후 코드북벡터를 사용하여 유사한 의미간의 거리부터 검색할 수 있는 특징을 가지고 있다. 특징추출에 관한 실험결과 인종별 구분을 위한 특징벡터로는 웨이블릿 주파수 성분(lowpass 성분)과 CbCr 특징벡터가 인종별 군집화에 가장 유용한 특징으로 선택되었으며. 추출된 특징을 바탕으로 semantic map을 구성하여 제안방법의 효율성을 제시하였다.

  • PDF

A Related Keyword Group Extraction Method for Keyword Marketing (키워드 마케팅을 위한 연관 키워드 추출 기법)

  • 이성진;이수원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.124-126
    • /
    • 2004
  • 인터넷 광고 시장의 급속한 성장과 함께 보다 효율적인 광고기법을 개발하기 위한 노력들이 이루어지고 있는 가운데 최근 들어 검색엔진의 특성을 이용한 키워드 광고가 주목을 받고 있다. 키워드 광고란 사용자가 입력한 검색어와 유사한 범주에 속하는 사이트의 광고를 검색 결과 페이지 상단에 보여주는 것을 말한다. 그러나, 키워드 광고는 키워드를 판매할 수 있는 위치가 한정적이기 때문에 판매 가능성이 있는 키워드에 대한 관리 및 판매 전략이 요구된다. 본 논문에서는 판매 가능성이 있는 키워드에 대한 관리 전략 수립을 위하여 연관 키워드 그룹을 자동으로 추출하는 기법을 제안한다. 연관 키워드 그룹의 생성은 사용자가 입력한 검색어에 의해 노출되는 사이트들을 묶어 그룹으로 형성하고 사이트 그룹의 중요 키워드를 추출한 다음 키워드간의 연관성을 판단하는 과정으로 이루어진다. 본 논문에서는 연관 키워드 그룹 추출의 각 단계를 구체적으로 설명하고 실험 결과를 분석한다. 마지막으로 연구의 결론과 향후 연구 과제에 대하여 기술한다.

  • PDF

A Property-based Code Extractor for Formal Code Verification (코드 정형검증을 위한 특성기반 코드추출기)

  • Park, Min-Gyu;Choi, Yunja;Kim, Jinsam
    • Annual Conference of KIPS
    • /
    • 2010.11a
    • /
    • pp.283-286
    • /
    • 2010
  • 안전중요 소프트웨어 코드의 검증은 1%의 잠재적 가능성을 가진 오류조차 허용하지 않는 철저한 검증방식을 요구한다. 이러한 요구에 부응하여 최근 수학적 모델을 사용한 정형검증 기법이 코드검증에 활발하게 적용되고 있으나, 코드의 복잡도와 크기의 증가에 따른 검증비용의 기하급수적 증가가 해결과제로 부각되어왔다. 본 연구에서는 검증하고자 하는 특성을 중심으로 검증대상 코드를 추출, 정형검증의 대상을 자동으로 축소하는 코드추출기를 개발하였다. 개발된 코드추출기는 자동차 전장용 운영체제의 검증에 보조적으로 활용되어 검증비용을 90% 이상 절감하고 검증 사용성을 높이는데 기여하였다.