• 제목/요약/키워드: 정보추출

검색결과 14,112건 처리시간 0.039초

피부색 정보를 이용한 적응적 얼굴 영역 추출 (Adaptive Face Region Extraction using Skin Color Information)

  • 이준우;송근원
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.359-361
    • /
    • 2003
  • 본 논문에서는 피부색 정의를 이용한 적응적 얼굴 영역 추출 알고리즘을 제안한다. 얼굴 영역 추출시 피부색 정보는 유용하게 이용되어 왔으나 피부색을 나타내는 문턱값에 매우 민감한 단점이 있다. 논문에서는 이를 개선하고자 먼저 후보 피부색 정보를 이용한 다음 전체 화소수와 추출된 화소수의 비에 따라 적응적으로 얼굴 영역을 추출하였다 인터넷 및 다양한 환경에서 획득된 영상에 대한 실험 결과 제안한 알고리즘은 얼굴 인식 과정의 얼굴 영역 추출 단계에서 정확한 얼굴 영역을 추출할 수 있음을 알 수 있었다

  • PDF

정보추출 기법을 이용한 서열정보분석 데이터베이스 구축 시스템 설계 (System Design for Building Sequence Information Analysis Databases using Information Extraction Techniques)

  • 이선아;전중남;이건명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.358-360
    • /
    • 2002
  • 인터넷의 확산과 첨단기술의 발달로 생물학 정보에 대한 온라인 데이터베이스 집합이 급속히 증가하고 있으나, 데이터의 양이 방대하고 이질적인 형태로 제공되기 때문에 실제 현장의 생물학 연구자들이 쉽게 이용하는데는 여러 가지 어려움이 있다. 이 논문에서는 단백질과 핵산 정보를 제공하는 대표적인 온라인 데이터베이스인 NCBL에, 질의를 하여 얻어진 데이터를 포함한 웹 문서로부터, 정보를 추출하여 사용자의 목적에 적합한 맞춤형 데이터베이스를 구축하는 시스템을 제안한다. 온톨로지를 이용하여 질의 처리를 하며, 웹 문서에 대한 정보추출 기법과 계층구조에 따른 유형별 저장방식을 통해 데이터베이스를 구축한다. 한편, 데이터 추출을 위해 식별 및 분류 작업을 수행한다. 제안한 시스템은 서열정보를 분석하는 생물학자들에게 관심대상 정보를 추출하여 맞춤형 데이터베이스를 구축함으로써, 손쉽게 서열정보 분석을 지원하도록 하는데 목적이 있다.

  • PDF

한국어 정보처리를 위한 명사 및 키워드 추출 (Noun and Keyword Extraction for Information Processing of Korean)

  • 신성윤;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.51-56
    • /
    • 2009
  • 언어에서 명사 및 키워드 추출은 정보처리에서 매우 필수적인 요소이다. 하지만, 한국어 정보처리에서 명사 추출과 키워드 추출은 아직도 많은 문제점을 안고 있다. 본 논문에서는 명사의 등장 특성을 고려한 효율적인 명사 추출 방법에 대해서 제시하였다. 제시한 방법은 대량의 문서를 빠르게 처리해야 하는 정보 검색과 같은 분야에서 유용하게 쓰일 수 있다. 또한 대량의 문제를 자동으로 분류하기 위하여 비감독 학습 기법에 의해 카테고리별 키워드를 구성하기 위한 방법을 제안하였다. 제안된 방법은 감독 학습 기법의 키워드 추출기법 중에서 우수하다고 알려진 X2기법과 DF 기법보다 우수한 분류 성능을 보였다.

양방향 장단기 메모리 네트워크를 활용한 높은 정밀도의 지지 근거 추출 (Extracting Supporting Evidence with High Precision via Bi-LSTM Network)

  • 박채훈;양원석;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-290
    • /
    • 2018
  • 논지가 높은 설득력을 갖기 위해서는 충분한 지지 근거가 필요하다. 논지 내의 주장을 논리적으로 지지할 수 있는 근거 자료 추출의 자동화는 자동 토론 시스템, 정책 투표에 대한 의사 결정 보조 등 여러 어플리케이션의 개발 및 상용화를 위해 필수적으로 해결되어야 한다. 하지만 웹문서로부터 지지 근거를 추출하는 시스템을 위해서는 다음과 같은 두 가지 연구가 선행되어야 하고, 이는 높은 성능의 시스템 구현을 어렵게 한다: 1) 논지의 주제와 직접적인 관련성은 낮지만 지지 근거로 사용될 수 있는 정보를 확보하기 위한 넓은 검색 범위, 2) 수집한 정보 내에서 논지의 주장을 명확하게 지지할 수 있는 근거를 식별할 수 있는 인지 능력. 본 연구는 높은 정밀도와 확장 가능성을 가진 지지 근거 추출을 위해 다음과 같은 단계적 지지 근거 추출 시스템을 제안한다: 1) TF-IDF 유사도 기반 관련 문서 선별, 2) 의미적 유사도를 통한 지지 근거 1차 추출, 3) 신경망 분류기를 통한 지지 근거 2차 추출. 제안하는 시스템의 유효성을 검증하기 위해 사설 4008개 내의 주장에 대해 웹 상에 있는 845675개의 뉴스에서 지지 근거를 추출하는 실험을 수행하였다. 주장과 지지 근거를 주석한 정보에 대하여 성능 평가를 진행한 결과 본 연구에서 제안한 단계적 시스템은 1,2차 추출 과정에서 각각 0.41, 0.70의 정밀도를 보였다. 이후 시스템이 추출한 지지 근거를 분석하여, 논지에 대한 적절한 이해를 바탕으로 한 지지 근거 추출이 가능하다는 것을 확인하였다.

  • PDF

PDF417 이차원 바코드 명상에서 심볼 정보를 추출하는 알고리즘의 구현 (Extracting Symbol Informations from PDF4172-Dimensional Barcode Image)

  • 한희일;정정구
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 춘계정기학술대회
    • /
    • pp.347-350
    • /
    • 2001
  • 종래에 사용되어 왔던 1 차원 바코드가 정보를 포함하고 있는 데이터베이스에 접근하는 데이터 키 역할을 주로 해온 것에 비해, 2 차원 바코드는 다량의 데이터를 포함할 수 있고 고밀도의 데이터 표현이 가능하여, 호스트 컴퓨터의 데이터 베이스에 온라인 연결할 필요 없이 확인하고자 하는 사람이나 대상물에 대한 정보를 얻을 수 있다. 본 논문에서는 가장 널리 사용되는 2 차원 바코드 체계인 PDF417 을 중심으로, 디지털 카메라를 통하며 입력한 영상을 이진화하여 시작 심볼 또는 정지 심볼을 검색함으로써 2 차원 바코드 영역을 추출한 다음, 추출된 영역으로부터 바코드의 행과 열의 수, 오류수정 정도 등의 헤더정보를 검출하고 이를 바탕으로 코드정보를 추출하는 알고리즘을 제안한다.

  • PDF

개선된 퍼지 기법을 이용한 경추 초음파 영상에서의 경부심굴곡근 추출 (Extraction of Deep Neck Flexors from Cervical Utrasound Images using Enhanced Fuzzy Techniques)

  • 한민수;이해정;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.204-207
    • /
    • 2011
  • 본 논문에서는 경추 초음파 DICOM 영상에서 개선된 퍼지 시그마 기법을 이용하여 경부심굴곡근을 추출하고 두께를 측정하는 방법을 제안한다. 제안된 방법은 ROI 영역에서 Ends-In Search Stretching을 적용하여 명암 대비를 강조한다. Stretching된 ROI 영역에서 평균 이진화를 적용한 후, Blob 알고리즘을 적용하여 흉쇄유돌근과 경부심굴곡근의 후보 영역을 추출한다. 추출된 경부심굴곡근 후보 영역에서 경추의 위치 정보를 이용하여, 경추의 경계 영역을 검출한 후, Cubic Spline 보간법 알고리즘을 적용하여 스플라인 곡선을 추출한다. 스플라인 곡선 영상에서 상/하 탐색 알고리즘을 적용하여, 최대/최소 범위 영역을 설정한다. Stretching된 ROI 영역에서 최대/최소 범위에 해당하는 영역에 대해 개선된 퍼지 시그마 이진화를 적용한다. 적용된 영역을 Blob 알고리즘을 이용하여 잡음을 제거하고 Morphology 알고리즘을 이용하여 초음파 영상의 첫 번째 경추 기준점의 좌표 정보를 추출한다. 경추 기준점을 기준으로 두께 측정에 필요한 경부심굴곡근 후보 영역을 추출하고 개선된 퍼지 시그마 이진화 알고리즘을 적용한다. 개선된 퍼지 시그마 이진화 알고리즘이 적용된 영상에서 근막의 위치 정보를 이용하여 경부심굴곡근상단 경계선을 추출한다. 추출된 각 경추 객체에 DDA(Digital Differential Analyzer) 알고리즘과 Cubic Spline 보간법 알고리즘을 적용하여 경부심굴곡근의 하단 경계선을 추출한다. 추출된 경부심 굴곡근의 상/하단 경계선의 위치 정보를 이용하여, 측정에 필요한 경부심굴곡근을 추출한다. 제안된 방법을 경추 초음파 영상에 적용하여 경부심굴곡근을 추출한 결과, 기존의 경부심굴곡근추출 방법보다 효율적으로 경부심굴곡근을 추출하는 것을 확인할 수 있었다.

  • PDF

사용자 인터페이스 기반 범용 웹 정보 추출 (GUI Based Generalized Fine-Grain Web Information Extractor)

  • 허정수;하상호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.40-42
    • /
    • 2006
  • 인터넷이 보급되면서 사용자는 자신이 원하는 정보를 인터넷으로 접근하였으며, 정보에 대한 수요는 늘어나 검색이나 포털을 통한 정보의 접근이 이루어지고 있다. 사용자들이 원하는 정보를 통합하더라도 사용자들은 자신이 원하는 정보를 얻기 위해 불필요한 정보에 노출된다 최근에 사용자가 필요한 웹 정보를 추출하는 연구가 진행되고 있으나, 이러한 연구는 추출 단위가 HTML 문서 수준이거나 일반적이지 못하다. 본 논문에서는 사용자가 원하는 임의의 웹 정보를 항목 단위의 수준에서 추출할 수 있는 사용자 인터페이스 기반 범용 웹 정보 추출기를 UML에 기반하여 설계하고 구현한다. 또한, 구현된 시스템에 대한 실행 예를 보인다.

  • PDF

공통평가기준 인증을 위한 SW의 내부 구조 및 복잡도 분석 사례에 관한 연구 (Case Study on Analysis for Well-Structured Internals and Complexity of Software for Common Criteria)

  • 최정란;서동수;배창환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.642-645
    • /
    • 2014
  • 본 논문은 EAL6 수준의 공통평가기준 인증을 위해 ADV(개발) 클래스에서 ADV_INT에 대해 기술하였다. 특히, 테스트용 스마트 운영체제 소스코드 분석을 통해 구현된 내부 구조가 잘 구조화되었는지, 지나치게 복잡하지 않았는지 입증하기 위해 시도를 하였다. 다양한 소스코드 분석 도구를 통해 사이클로매틱복잡도(CyC), 정보흐름복잡도(IFC), Weighted IFC, fan-in, fan-out 등의 정보를 추출하였고, 추출된 정보를 기반으로 적용하여 수행하였다. 구조화된 정보 분석을 위해 객체지향 분석 도구를 사용한 재구조화 기법을 적용하여 수행하였다. 객체간 결합도, 팬아웃 등의 정보 등을 추출하였다. 추출된 정보를 기반으로 SW의 복잡도 및 구조적 정보를 분석한 결과 응집도 분석에 한계, TOE의 형상관리 정보 등의 부재에 따른 추출된 정보 분석의 한계, 활용된 도구의 분석 정보의 재반영 부재 및 구조적 분석 등의 한계점이 드러났다.

정보추출결과의 시각화 표현방법에 관한 이용성 평가 연구 (A Usability Evaluation on the Visualization of Information Extraction Output)

  • 이지연
    • 한국문헌정보학회지
    • /
    • 제39권2호
    • /
    • pp.287-304
    • /
    • 2005
  • 이 연구의 목적은 자동적으로 추출된 정보를 시각화 브라우저를 통해 표현하고 접근하는 방법에 대해 이용성평가를 수행하는 것이다. 특정 주제 분야에 국한되지 않는 정보추출시스템을 사용하여 신문기사에서 의미정보를 자동 추출하였고, 그 결과로 시각적으로 브라우저 할 수 있는 지식베이스를 구축하였다. 이 연구에 이용된 정보추출시스템은 신문기사의 텍스트정보로부터 다양한 자연언어처리 기술을 적용하여 개념-관계-개념의 형태로 표현되는 정보를 자동적으로 추출하였다. 지식베이스에 저장된 정보를 시각적으로 표현하는 시각화 브라우저를 구현하였는데, 이때 인터페이스 부분은 쌍곡면형 정보시각화 시스템의 하나인 PersonalBrain을 이용하여 개발하였다. PersonalBrain을 이용하면 표현하고자 하는 정보를 논리관계의 네트워크 형태로 연결할 수 있다. 지식베이스 정보의 시각화 접근방법에 대하여 15명의 이용자를 대상으로 질적 평가를 수행하였다. IS명의 연구대상자로 하여금 시각화 브라우저를 이용하도록 하고 관찰과 인터뷰를 통하여 이용성평가 데이터를 수집하였다. 내용분석결과, 이용자들은 정보추출결과의 시각화 브라우저 이용가능성에 대해 긍정적인 반응을 보인 동시에 몇 가지 이용성 관련 문제점을 지적하였다.

배경과 칼라정보를 이용한 얼굴 추출 (Face Extraction using Background and Color Information)

  • 정해찬;유혜원;권영탁;소영성
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2001년도 하계 학술대회 논문집(KISPS SUMMER CONFERENCE 2001
    • /
    • pp.161-164
    • /
    • 2001
  • 본 논문에서는 배경과 색 정보를 이용하여 얼굴을 추출하는 알고리즘을 제안한다. 영상에서의 얼굴 추출에 관한 방법에는 칼라 영상을 가정한 방법, 농담 영상을 가정한 방법, 얼굴의 회전에 덜 민감한 방법, 복잡한 배경에서의 얼굴 추출 방법 등이 연구되어 있다. 본 논문에서는 배경생성을 통해 물체를 구분하고 칼라 정보(HSI 칼라 모델)를 이용하여 얼굴을 추출한다. 배경생성은 각 픽셀 위치에서의 밝기 값을 장시간 평균하거나 혹은 장시간 누적된 밝기 값들 중 최빈 값을 사용하는데 이 방법은 영상 내 물체의 이동이 정체가 별로 없이 원활한 곳에서는 질 좋은 배경을 생성 할 수 있다. 하지 만 배경의 밝기 값을 누적하는 과정에서 물체의 정지상황이 장시간 반영될 경우 배경 영상의 질이 낮아지는 난점이 있다. 따라서, 배경생성 과정에 하이레벨 정보인 물체의 탐지 결과를 이용하여 움직임이 없는 부분에 대해서만 배경생성에 반영함으로써 좀 더 나은 배경을 생성할 수 있다. 이렇게 생성된 배경을 이용해서 입력 영상과의 배경차이를 하게되면 영상 내에서 배경이 아닌 모든 물체를 추출할 수 있다. 물체를 추출 한 후 얼굴 색깔과 유사한 칼라 영역을 분리하고 추출된 물체의 윗 부분에 얼갈이 위치한다는 가정 하에 일괄을 추출한다.

  • PDF