• 제목/요약/키워드: semantic classification

검색결과 329건 처리시간 0.028초

디지털 아카이브즈의 문제점과 방향 - 문화원형 콘텐츠를 중심으로 - (Digital Archives of Cultural Archetype Contents: Its Problems and Direction)

  • 함한희;박순철
    • 한국비블리아학회지
    • /
    • 제17권2호
    • /
    • pp.23-42
    • /
    • 2006
  • 본고는 문화원형콘텐츠를 유통시키고 있는 문화콘텐츠닷컴의 디지털아카이브 시스템에 주목해서 문제점을 분석하고 대안을 제시하는 것이 목적이다. 문화원형콘텐츠는 전통문화와 컴퓨터기술을 접목시켜 개척한 새로운 분야이다. 정부에서는 이 산업을 육성해서 한국문화의 세계화와 국가 경쟁력을 강화시킬 의도를 가지고 있다. 우리나라의 역사와 전통 풍물 생활 전승 예술 지리지 등 다양한 분야의 문화원형을 디지털 콘텐츠화하여 문화산업에 필요한 창작소재로 제공하는 것이 그 핵심내용이다. 아울러 디지털 콘텐츠 유통체계 정립과 저작권 관리를 통해서 공공부문 문화콘텐츠의 산업적 활용도를 제고하려는 의도도 포함된다. 본고에서 다루는 대상자료는 현재 문화콘텐츠닷컴에서 유통, 관리되고 있는 문화원형콘텐츠들이다. 이 성과물들은 2002년부터 2005년까지 개발되어서 문화콘텐츠닷컴 DB에 구축되어 있다. 이 자료들을 통해서 현재의 디지털아카이브 시스템의 문제점을 분석하였고, 현재의 시스템이 안고 있는 한계점을 요약하면 다음과 같다. 첫째는 각 자료에서 사용하는 주요 용어의 선택에 따라 유사한 자료들이 서로 다른 주제로 분류되면서 다른 항목에 속하게 되는 것이다. 둘째는, 따라서 서로 다른 항목 간에 교차검색이 이루어지지 않는 한계점이 있다. 현재의 제 문제를 해결할 수 있는 방법으로 본고에서는 온톨로지 기능을 포함한 데이터마이닝시스템을 이용해서 풍부한 지식정보표현과 활용이 가능한 디지털아카이브 시스템을 제안하고 있다. 데이터마이닝은 다섯 가지의 방법으로 가능하다. 의미검색 문서요약 문서클러스터링 문서분류 그리고 주제추적이다. 최근에 빠르게 개발되고 있는 디지털 신기술도 인문학과 긴밀하게 연결되지 않으면, 그 활용도가 제한적이라는 점을 본고를 통해서 지적하였다. 창작소재로서의 문화원형콘텐츠의 활용도를 크게 향상시킬 수 있는 길은 바로 신지식관리를 위한 통학적(uni-discipline) 접근이라는 점을 일깨우고자 한다.

CBD 아키텍처 기반 e-비즈니스 에이전트 프로토타이핑 시스템 (The e-Business Agent Prototyping System with Component Based Development Architecture)

  • 신호준;김행곤
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.133-142
    • /
    • 2004
  • 차세대 웹 애플리케이션은 거대하고 복잡하고 유연성을 요구한다. 에이전트 지향 시스템은 이러한 애플리케이션에 큰 가능성을 가지고 있으며, 에이전트는 동적으로 발견할 수 있고, e-서비스를 합성할 수 있고 상호작용을 중재할 수 있다. CBD(Component Based Development)를 통한 소프트웨어 에이전트의 개발은 프로젝트의 개발 속도를 증가시키며, 좀 더 나은 품질을 제공하며 낮은 개발비용으로 성공을 증명할 수 있다. 본 논문에서는 컴포넌트와 UML(Unified Modeling Language)을 사용한 소프트웨어 에이전트를 위한 체계적인 개발 프로세스를 제안한다. 일반 에이전트와 e-비즈니스 에이전트의 분류를 통해 식별된 관련 컴포넌트 계층에 대한 ebA-CBD 참조 아키텍처를 제시한다. 또한, UML로 사용한 의미적인 프레임워크에서 에이전트 지향 개념을 기반 함으로써 기존의 에이전트 지향 소프트웨어 광학 방법론의 특징을 고려한 가이드라인으로 ebA-CBD 프로세스를 제안한다. 첫 번째로 에이전트 컴포넌트 명세를 개발하고, 목표, 역할, 상호작용과 아키텍처 모델을 작성한다. 제안된 프로세스에 따라 사례 연구로서 상품정보의 메일링 서비스인 e-CPIMAS(e-Commerce Product Information Mailing Agent System)를 개발한다. 끝으로 비즈니스 애플리케이션과 e-비즈니스 에이전트를 개발하기 위해 그 효율성, 재사용성, 생산성과 품질성 증가를 기대한다.

MPEG-2 비트열로부터 객체 기반 MPEG-4 응용을 위한 고속 정보 추출 알고리즘 (Fast information extraction algorithm for object-based MPEG-4 application from MPEG-2 bit-streamaper)

  • 양종호;원치선
    • 한국통신학회논문지
    • /
    • 제26권12A호
    • /
    • pp.2109-2119
    • /
    • 2001
  • 본 논문에서는 MPEG-2 비트열로부터 객체 기반 MPEG-4로의 고속 변환을 위한 정보 추출 알고리즘을 소개한다. 객체 기반 MPEG-4로의 변환을 위한 정보로써 객체 영상과 형상 정보, 매크로블록 움직임 벡터, 헤더정보가 MPEG-2로부터 추출된다. 추출된 정보를 이용하면 객체 기반 MPEG-4로의 고속 변환이 가능하다. 가장 중요한 정보인 객체 영상 추출은 MPEG-2의 움직임 벡터와 워터쉐드 알고리즘을 이용하여 이루어진다. 사용자의 인지정보를 이용하여 프레임 내에서 객체를 추출하고, 추출된 객체로 연속된 프레임에서 객체를 추적하게 된다. 수행 중 객체의 빠른 움직임으로 만족스럽지 못한 결과를 내더라도, 사용자가 개입하여 다시 좋은 결과를 얻을 수 있도록 하였다. 객체 추적 과정은 크게 두 단계로 객체 추출 단계와 객체 추적 단계로 나누어져 있다. 객체 추출 단계는 블록분류와 워터쉐드 알고리즘으로 자동 분할된 영상에서 사용자가 직접 객체를 추출하는 단계이다. 사용자가 개입하는 단계이기 때문에, 번거로울 수 있으나 손쉽게 추출할 수 있도록 구현하였다. 객체 추적 단계는 연속된 프레임 에서 객체를 추적하는 단계로 MPEG-2 움직임 벡터와 객체 모양 정보를 이용하여 고속으로 구해지고 워터쉐드 알고리즘으로 윤곽선 보정작업을 하였다. 실험 결과 MPEG-2 비트스트림으로부터 객체 기반 MPEG-4로의 고속변환이 가능함을 알 수 있었다.

  • PDF

텍스트 분석 기술 및 활용 동향 (Investigations on Techniques and Applications of Text Analytics)

  • 김남규;이동훈;최호창
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.471-492
    • /
    • 2017
  • 최근 데이터의 양 자체가 해결해야 할 문제의 일부분이 되는 빅데이터(Big Data) 분석에 대한 수요와 관심이 급증하고 있다. 빅데이터는 기존의 정형 데이터 뿐 아니라 이미지, 동영상, 로그 등 다양한 형태의 비정형 데이터 또한 포함하는 개념으로 사용되고 있으며, 다양한 유형의 데이터 중 특히 정보의 표현 및 전달을 위한 대표적 수단인 텍스트(Text) 분석에 대한 연구가 활발하게 이루어지고 있다. 텍스트 분석은 일반적으로 문서 수집, 파싱(Parsing) 및 필터링(Filtering), 구조화, 빈도 분석 및 유사도 분석의 순서로 수행되며, 분석의 결과는 워드 클라우드(Word Cloud), 워드 네트워크(Word Network), 토픽 모델링(Topic Modeling), 문서 분류, 감성 분석 등의 형태로 나타나게 된다. 특히 최근 다양한 소셜미디어(Social Media)를 통해 급증하고 있는 텍스트 데이터로부터 주요 토픽을 파악하기 위한 수요가 증가함에 따라, 방대한 양의 비정형 텍스트 문서로부터 주요 토픽을 추출하고 각 토픽별 해당 문서를 묶어서 제공하는 토픽 모델링에 대한 연구 및 적용 사례가 다양한 분야에서 생성되고 있다. 이에 본 논문에서는 텍스트 분석 관련 주요 기술 및 연구 동향을 살펴보고, 토픽 모델링을 활용하여 다양한 분야의 문제를 해결한 연구 사례를 소개한다.

폭소노미 태그의 생성과 성장에 관한 연구 - LibraryThing을 중심으로 - (A Study on Creation and Development of Folksonomy Tags on LibraryThing)

  • 김동숙;정연경
    • 한국문헌정보학회지
    • /
    • 제44권4호
    • /
    • pp.203-230
    • /
    • 2010
  • 본 연구는 LibraryThing내의 베스트셀러 40권에 대한 태그를 6개월 간격으로 수집하여 폭소노미의 생성과 성장을 분석하였다. 이를 통해 태그의 양적, 질적 성장과 그러한 태그가 갖는 주된 의미와 주제 표현의 활용가능성을 살펴보았다. 본 연구의 결과로 첫째, 이용자 태깅의 동기는 개인의 자료 정리나 검색용도, 욕구의 성취, 감정 표출과 같은 자신을 위한 목적과 타인과 경험을 공유하거나 자신의 행동이 사회에 도움이 되길 바라는 사회성이 강조된 목적으로 구분되며, 사회적 동기가 부여된 태그는 74.12%로 드러났다. 둘째, 시간의 흐름에 따라 전체 태그 수와 이용 빈도수에서 성장세를 보였다. 셋째, 태그의 성장세가 큰 항목은 출판 시기 및 읽은 시기, 장르, 핵심 주제어, 등장인물, 책에 대한 소감 부분이었으며 주제관련 태그의 비율이 가장 높은 비중을 차지하였다. 넷째, LCSH 중에서 해당 장르, 핵심 주제어, 등장인물이 다수 부여되었으며 시간이 흐르면서 좀 더 세부적인 핵심 주제어와 등장인물이 추가되었고, LCSH와 일치하는 태그의 수도 소폭 상승하였다. 다섯째, 핵심 태그는 해당 시대의 지식을 반영하는 용어 집단으로서 역할을 하는 것으로 나타났다. 앞으로 폭소노미가 형태적인 단점을 극복하고, 내적으로 시맨틱 의미를 찾으며, 일대기를 고려한 유동적인 용어집단으로서 기존의 택소노미와 함께 적극 활용되기 위해서는 태그의 생성부터 양적, 질적 성장까지 전 과정을 지속적으로 모니터링하고 지원해야 할 것이다.

항공 라이다 데이터를 이용한 건물 모델링의 자동화 (Automation of Building Extraction and Modeling Using Airborne LiDAR Data)

  • 임새봄;김정현;이동천
    • 한국측량학회지
    • /
    • 제27권5호
    • /
    • pp.619-628
    • /
    • 2009
  • LiDAR는 광범위한 지역의 지형 지물 및 지표면에 대한 3차원 좌표를 신속하게 획득할 수 있는 장비로 고정밀의 3차원 공간데이터를 제공하는 장점이 있다. 그러나 LiDAR 데이터는 불규칙한 3차원 점 데이터로 구성되어 있으므로, 의미적이고 시각적인 정보를 제공하지 않으며, LiDAR 데이터만을 사용하여 정보를 추출하는 것은 어렵다. 본 연구에서는 항공 LiDAR 데이터로부터 건물의 외곽선 자동 추출 및 3차원 상세 모델링을 위한 방법을 제안하였다. 전처리 과정으로 반복적 평면 fiitting을 통하여 노이즈 및 불필요한 데이터를 제거하고, 히스토그램 분석을 수행하여 지면과 비지면 데이터를 효과적으로 분리하였다. 건물 외곽선을 추출하기 위해서 객체추적 기법을 이용하여 건물의 외곽에 해당하는 LiDAR 점들을 분류하였으며, 선행과정을 통해 LiDAR 데이터로부터 최종적으로 건물의 외곽선을 추출하였다. 정확도 검증을 위해 추출된 건물의 외곽선을 1:1,000 수치지도와 비교한 결과, 실험지역의 평면 RMSE가 약 0.56m였다. 또한, 건물의 상부구조물의 형태를 재현하기 위한 특성정보 추출 방법을 제안하였다. 지붕면을 세부적으로 분할하고 모델링하기 위하여 통계적 및 기하적 특성정보를 이용하였으며, 각각의 상부구조물에 적합한 수학적 함수를 최소제곱법에 의해 결정함으로써 3차원 모델링이 가능하도록 하였다. 상부구조물 모델링 결과 각 형태에 따른 RMSE가 사각형 상부구조물은 0.91m, 삼각형 상부구조물은 1.43m, 아치형 상부구조물은 1.85m, 돔형 상부구조물이 1.97m였다. 이는 원시 LiDAR 데이터로부터 지붕면 분할 및 3차원 자동 모델링이 효과적으로 수행되었음을 보여주고 있다.

MPEG-1,2로부터 객체 기반 MPEG-4 변환을 위한 고속 정보 추출 알고리즘 (Fast information extraction algorithm for object-based MPEG-4 conversion from MPEG-1,2)

  • 양종호;박성욱
    • 전자공학회논문지CI
    • /
    • 제41권3호
    • /
    • pp.91-102
    • /
    • 2004
  • 본 논문에서는 MPEG-1,2로부터 객체 기반 MPEG-4로의 고속 변환을 위한 정보 추출 알고리즘을 소개한다. 객체 기반 MPEG-4로의 변환을 위한 정보로써 객체 영상과 형상 정보, 매크로블록 움직임 벡터, 헤더정보가 MPEG-4로부터 추출된다. 추출된 정보를 이용하면 객체 기반 MPEG-4로의 고속 변환이 가능하다. 가장 중요한 정보인 객체 영상 추출은 MPEG-2의 움직임 벡터와 워터쉐드 알고리즘을 이용하여 이루어진다. 사용자의 인지정보를 이용하여 프레임 내에서 객체를 추출하고, 추출된 객체로 연속된 프레임에서 객체를 추적하게 된다. 수행 중 객체의 빠른 움직임으로 만족스럽지 못한 결과를 내더라도, 사용자가 개입하여 다시 좋은 결과를 얻을 수 있도록 하였다. 객체 추적 과정은 크게 두 단계로 객체 추출 단계와 객체 추적 단계로 나누어져 있다. 객체 추출 단계는 블록분류와 워터쉐드 알고리즘으로 자동 분할된 영상에서 사용자가 직접 객체를 추출하는 단계이다. 사용자가 개입하는 단계이기 때문에, 번거로울 수 있으나 손쉽게 추출할 수 있도록 구현하였다 객체 추적 단계는 연속된 프레임에서 객체를 추적하는 단계로, MPEG-1,2 움직임 벡터와 객체 모양 정보를 이용하여 고속으로 구해지고 워터쉐드 알고리즘으로 윤곽선 보정작업을 하였다 실험 결과 MPEG-1,2 비트스트림으로부터 객체 기반 MPEC-4로의 고속 변환이 가능함을 알 수 있었다.

영역정보기반의 유전자알고리즘을 이용한 텍스트 후보영역 검출 (Detection of Text Candidate Regions using Region Information-based Genetic Algorithm)

  • 오준택;김욱현
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.70-77
    • /
    • 2008
  • 본 논문은 화소 단위의 정보가 아닌 분할된 영역들의 정보를 기반으로 유전자 알고리즘을 이용한 텍스트 후보영역 검출방안을 제안한다. 먼저, 영상분할을 수행하기 위해 색상별 화소분류와 비동질적인 군집의 감소를 위한 영역 단위의 재분류 알고리즘을 수행한다. 색상별 화소분류에 이용되는 EWFCM(Entropy-based Weighted Fuzzy C-Means) 알고리즘은 공간정보를 추가한 개선된 FCM 알고리즘으로써, 잡음에 강건한 특징을 가진다. EWFCM 알고리즘에 의해 분류된 화소들의 군집정보를 기반으로 수행되는 영역 단위의 재분류는 화소나 군집 단위의 재분류에 비해 효과적으로 영상에 존재하는 비동질적인 군집들을 감소시킬 수 있다. 그리고 텍스트 후보영역 검출은 분할된 영역들로부터 추출한 방향성 에지 성분에 대한 분산값 및 에너지, 크기, 개수 등의 정보를 기반으로 유전자알고리즘에 의해 수행된다. 이는 화소 단위의 정보를 이용한 방법보다 더 명확한 텍스트 영역정보를 획득할 수 있으며, 향후 자동문자인식에서 좀 더 손쉽게 이용될 수 있다. 실험 결과 제안한 분할방법은 기존 방법이나 화소나 군집 기반의 재분류보다 좋은 결과를 보였으며, 텍스트 후보영역 검출에서도 화소 단위의 정보를 이용한 기존 방법보다 더 좋은 결과를 보여 제안방법의 유효성을 확인하였다.

딥러닝 기반 터널 콘크리트 라이닝 균열 탐지 (Deep learning based crack detection from tunnel cement concrete lining)

  • 배수현;함상우;이임평;이규필;김동규
    • 한국터널지하공간학회 논문집
    • /
    • 제24권6호
    • /
    • pp.583-598
    • /
    • 2022
  • 인력기반 터널 점검은 점검자의 주관적인 판단에 영향을 받으며 지속적인 이력관리가 어렵다. 따라서 최근에는 딥러닝 기반 자동 균열 탐지 연구가 활발히 진행되고 있다. 하지만 대부분의 연구에서는 사용하는 대규모 공개 균열 데이터셋은 터널 내부에서 발생하는 균열과 매우 상이하다. 또한 현행 터널 상태평가에서 정교한 균열 레이블을 구축하기 위해서는 추가적인 작업이 요구된다. 이에 본 연구는 균열 형상이 다소 단순하게 표현된 기존 데이터셋을 딥러닝 모델에 입력하여 균열 탐지 성능을 개선하는 방안을 제시한다. 기존 터널 데이터셋, 고품질 터널 데이터셋과 공개 균열 데이터셋을 조합하여 학습한 딥러닝 모델의 성능 평가와 비교를 수행한다. 그 결과 Cross Entropy 손실함수를 사용한 DeepLabv3+에 공개 데이터셋, 패치 단위 분류와 오버샘플링을 수행한 터널 데이터셋을 모두 학습한 경우 성능이 가장 좋았다. 향후 기 구축된 터널 영상 취득 시스템 데이터를 딥러닝 모델 학습에 효율적으로 활용하기 위한 방안을 수립하는 데 기여할 것으로 기대한다.

다목적실용위성 영상처리 및 활용 (KOMPSAT Image Processing and Application)

  • 이광재;김예슬;채성호;오관영;이선구
    • 대한원격탐사학회지
    • /
    • 제38권6_4호
    • /
    • pp.1871-1877
    • /
    • 2022
  • 과거 위성개발에는 막대한 예산과 시간이 소요됨에 따라 일부 선진국만 위성을 보유하였으나, 최근 초소형위성과 같은 저예산 위성이 등장함에 따라 전 세계 많은 국가들이 위성 개발에 참여하고 있다. 저궤도 및 정지궤도 위성은 환경 및 기상 감시, 정밀변화탐지, 재난 등 다양한 분야에서 활용되고 있으며, 최근에는 딥러닝 기반의 관심 객체탐지 등을 통한 모니터링에도 활발히 이용되고 있다. 우리나라는 지금까지 우주개발계획에 따라 국가 수요의 위성을 개발하여 왔으며, 이를 통해 획득한 위성영상은 공공 및 민간에서 다양한 목적으로 활용되고 있다. 국내에서 위성영상에 대한 관심은 지속적으로 증가하고 있으며, 각종 아이디어 발굴 및 기술개발 촉진을 위한 다양한 경진대회도 개최되고 있다. 본 특별호에서는 최근 개최된 2022 위성정보활용 경진대회에 참여한 주제와 다목적실용위성 영상자료 처리 및 활용 연구에 대해서 소개하고자 한다.