• 제목/요약/키워드: 단어 영상 추출

검색결과 65건 처리시간 0.03초

웹 문서의 단어정보와 링크정보 결합을 이용한 클러스터링 기법 (Clustering Method Using the Union Information of Term Frequency and Link in Hypertext)

  • 이원희;이교운;박흠;김영기;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-107
    • /
    • 2003
  • 최근의 웹 문서는 텍스트 위주의 구성이 아닌 이미지, 사운드, 동영상 등의 다양한 타입으로 구성되는 추세이다. 이에 따라 단순히 웹 문서 내의 단어 정보추출 만으로는 좋은 성능의 클러스터링을 기대하기 어렵다. 본 논문은 전통적인 문서 클러스터링 기법인 단어기반 클러스터링 기법의 취약점을 제시하고, 웹 문서간의 링크구조정보 중 동시인용 정보를 이용하여 웹 문서 클러스터링 성능향상의 가능성을 보이고자 한다. 실험에서는 네이버디렉토리 중 '자연과학' 범주에 포함된 문서를 대상으로 위의 두 가지 방식과 이 두 가지를 혼합한 단어-링크 혼합 클러스터링을 통해 기존의 방식보다 더 낳은 성능을 얻을 수 있었다.

  • PDF

LSTM을 활용한 수어 단어 인식 (Recognition of Sign Language using LSTM)

  • 정의손;조동휘;박세희;강현아;박승보
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.287-288
    • /
    • 2022
  • 기존 수어 통역 서비스의 문제점들을 보완하고 대체할 수 있는 수단이 필요하다. 본 논문에서는 LSTM을 활용한 수어 단어 번역을 제안한다. 데이터는 총 단어의 개수 56개를 사람 16명으로, 그리고 관측 방향을 5개로 나누어 총 4480개의 단어별 영상을 사용하였다. 학습 횟수 250회 검증 정확도는 78%에 도달하였다.

  • PDF

문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색 (Keyword Spotting on Hangul Document Images Using Character Feature Models)

  • 박상철;김수형;최덕재
    • 정보처리학회논문지B
    • /
    • 제12B권5호
    • /
    • pp.521-526
    • /
    • 2005
  • 본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다.

YouTube 동영상 의견분석을 통한 사용과 충족 이론 측정 : 트로트 가수 조명섭 동영상을 중심으로 (Analyzing Comments of YouTube Video to Measure Use and Gratification Theory Using Videos of Trot Singer, Cho Myung-sub)

  • 홍한국;임병학;김삼문
    • 한국콘텐츠학회논문지
    • /
    • 제20권9호
    • /
    • pp.29-42
    • /
    • 2020
  • 본 연구의 목적은 소셜미디어 중 하나인 YouTube 동영상 사용자들이 남긴 의견을 추출하여 분석하는 질적연구방법을 제시한다. 이를 위해서 YouTube 동영상 사용자의견을 사용하여 사용과 충족 이론의 쾌락적 충족, 사회적 충족, 그리고 실용적 충족을 빈도분석과 토픽모델링을 통해 측정하였다. 측정결과, YouTube KBS 한국방송 채널 중 트로트 가수 조명섭 동영상을 사용자들이 시청하는 이유는 첫 번째로 높은 빈도를 보이는 것이 쾌락적 충족을 위해서였다. 다음 순으로 사회적 충족과 실용적 충족으로 나타났다. 단어-문서 네트워크 분석에서 연결정도중심성은 '응원', '감사', '화이팅', '최고' 등이 높게 나타났고, 매개중심은'감사', '응원', '화이팅'등의 단어가 높게 나타나 연결정도 중심성과 유사함을 보였다. 아이겐벡터중심성은 '사랑', '마음', '감사' 등의 단어가 높게 나타나 사용자들의 의견들에 가장 영향력이 높은 단어들임을 알 수 있다. 이는 YouTube의 트로트 가수 조명섭 동영상 시청자들 중 대다수가 동영상에 대해 사랑과 감사의 마음을 보이고 있음을 알 수 있다. 위의 세 가지 중심성 분석결과는 동영상을 시청하는 동기로 사용충족 이론의 쾌락적 충족과 사회적 충족 관련 단어들이 높은 값을 보이고 있다. 본 연구는 설문조사 기반의 구조방정식 모형을 따르지 않고, 질적분석연구를 자동화한 텍스트마이닝 기법을 사용하여 YouTube동영상을 사용하는 동기를 사용 및 충족 이론에 의해 밝혀냈다는 것에서 연구 함의를 찾을 수 있다.

카메라 기반 문서영상에서의 문자 추출 (Text extraction from camera based document image)

  • 박희주;김진호
    • 한국산업정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.14-20
    • /
    • 2003
  • 본 논문에서는 카메라로 획득한 문서영상에 대해 조명의 영향에 관계없이 고속으로 문자영역을 추출하는 알고리즘을 제안하였다. 카메라 문서는 스캐너 문서와는 달리 주변 환경이나 조명의 영향으로 인하여 문자영역을 추출하는 것이 매우 어렵다. 먼저 영상 사전처리 단계에서 컬러영상을 명도영상으로 변환한 후 조명의 영향에 무관하게 배경 그림으로부터 문자 영역을 정확히 추출하기 위해서 명도레벨 정규화를 사용하였다. 또한 배경 그림 및 잡음은 제거하고 문자 획의 손실 없이 문자 영역을 추출하기 위하여 국소-적응적-이진화-방법(local adaptive binarization method)을 새롭게 개발하여 문서영상을 이진화시켰다. 문자영역 추출 단계에서는 수평 및 수직 투영과 연결요소 정보에 의해 문자열, 단어 및 개별 문자 영역을 단계적으로 추출하였다. 제안된 방법의 타당성을 검증하기 위하여 ETRI에서 구축한 한글/영어/숫자/특수기호가 혼합된 현장 문서영상 DB를 가지고 실험해 보았다.

  • PDF

음란콘텐츠에 기반한 유해 음란 사이트의 차단 (Blocking of Internet Harmful Pornographic Sites by Contents-based Method)

  • 조동욱
    • 한국통신학회논문지
    • /
    • 제29권6B호
    • /
    • pp.554-562
    • /
    • 2004
  • 본 논문에서는 인터넷 역기능에 있어 가장 큰 문제로 인식되고 있는 유해 음란 사이트를 기술적으로 차단하기 위한 방법론을 제안하고자 한다. 현재까지의 기술적 차단 방법이 주로 목록 기반과 단어 기반 방법이었기 때문에 새로이 생겨나는 사이트나 단어를 교묘히 변경한 경우 음란사이트 차단이 제대로 되지 않았다. 이를 위해 본 논문에서는 음란물의 내용이 될 수 있는 즉, 음란물에서 성행위시 나오는 신음소리와 음란 영상을 추출하여 음란 사이트를 차단하고자 한다. 이를 위해 질감 분석, 곡선 적합 등을 통해 영상에서 성적 주요 부위를 추출하였으며 프라트툴을 이용하여 음향 신호를 분석한 후 자기 상관 함수로 음란 음향 신호를 차단하였다. 최종적으로 실험에 의해 본 논문의 유용성을 입증하고자 한다.

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2002년도 추계공동학술대회 정보환경 변화에 따른 신정보기술 패러다임
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기발에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 추계공동학술대회
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

CT 영상에서의 간 영역 추출 및 간 종양 분석

  • Jang Do-Won;Lim Eun-Kyung;Kim Chang-Won;Kim Min-Hwan;Kim Kwang-Baek
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.183-192
    • /
    • 2006
  • 간세포암은 우리나라에서 전체 암사망자 중 17.2%로 3번째의 흔한 사망원인이며, 간암에 의한 사망률은 인구 10만 명당 약 21명에 이른다. 본 논문에서는 간 내부에서 발생하는 간세포암을 CT 영상에서 자동으로 추출하는 방법을 제안하여 간세포암의 보조진단으로서의 유용성에 대해 알아보고자 한다. 간 내부의 종양을 추출하기 위해 흉부의 윗부분에서 시작하여 2.5mm의 간격으로 약 45-50장 정도를 촬영한 CT 영상들을 대상으로 먼저 간 영역을 추출한다. 간 영역 추출은 먼저 관심이 없는 외부 영역을 갈비뼈를 중심으로 제거한 후 영상의 밝기 정보를 이용하여 각 기관의 영역을 분할 한다. 분할된 영역들은 위 아래로 인접한 영상에서의 분할 영역들과 밝기 값을 비교하여 적절하게 병합하는 3차원적 접근방법을 사용한다. 간 영역은 여러개의 영역들 중에서 간 영역의 구조 및 위치 등의 정보를 활용하여 추출한다. 추출된 간 영역에서 종양 판별과 추출을 위해 종양이 가지는 특징을 분석하여 종양을 추출한다. 전형적인 간세포암은 과혈관성 종양이므로 조영증강 CT 영상에서 주위보다 밝은 색으로 나타나며, 팽창 형성장을 보일 경우에는 구형으로 나타나는 특징이 있다. 이에, 주위 보다 밝은 색을 가지고 둥근형태를 가지는 영역을 종양의 후보영역으로 선정한 후, 그 영상의 위와 아래로 연결되는 영상에서도 같은 위치에서 같은 특징을 보이는 영역이 있으면 간 내부의 종양으로 판별하여 추출한다. 제안된 간 영역 및 간 종양 추출 방법의 정확성을 판별하기 위하여 CT 영상을 대상으로 실험하여 영상의학 전문의가 판단한 결과와 비교하였다. 간 영역 추출은 정확히 모두 추출되었으며, 간 종양 추출 및 판별은 전문의의 보조 진단도구로 활용할 수 있는 가능성이 매우 높다는 것을 확인할 수 있었다.emantic Similarity Measure 등을 단계적으로 수행하여 자동화되고 정확한 규칙식별을 하고자 한다. 이러한 방법들의 조합으로 인하여 규칙구성요소 추출이 되지 않을 후보 단어들의 수를 줄여서 보다 더 정확하고, 지능적인 규칙구성요소 추출 방법론을 제시하고 구현하여 지식관리자의 규칙습득에 대한 부담을 줄여 주고자 한다. 도움을 받을 수 있게 되었다.을 거치도록 되어있다. 교통주제도는 국가의 교통정책결정과 관련분야의 기초자료로서 다양하게 활용되고 있으며, 특히 ITS 노드/링크 기본지도로 활용되는 등 교통 분야의 중요한 지리정보로서 구축되고 있다..20{\pm}0.37L$, 72시간에 $1.33{\pm}0.33L$로 유의한 차이를 보였으므로(F=6.153, P=0.004), 술 후 폐환기능 회복에 효과가 있다. 4) 실험군과 대조군의 수술 후 노력성 폐활량은 수술 후 72시간에서 실험군이 $1.90{\pm}0.61L$, 대조군이 $1.51{\pm}0.38L$로 유의한 차이를 보였다(t=2.620, P=0.013). 5) 실험군과 대조군의 수술 후 일초 노력성 호기량은 수술 후 24시간에서 $1.33{\pm}0.56L,\;1.00{\ge}0.28L$로 유의한 차이를 보였고(t=2.530, P=0.017), 술 후 72시간에서 $1.72{\pm}0.65L,\;1.33{\pm}0.3L$로 유의한 차이를 보였다(t=2.540, P=0.016). 6) 대상자의 술 후 폐환기능에 영향을 미치는 요인은 성별로 나타났다. 이에 따른 폐환기능의 차이를 보면, 실험군의 술 후 노력성 폐활량이 48시간에 남자($1.78{\pm}0.61L$)가 여자(

  • PDF

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF