• 제목/요약/키워드: 정보 수집 및 추출

검색결과 752건 처리시간 0.03초

텍스트 분석 기술 및 활용 동향 (Investigations on Techniques and Applications of Text Analytics)

  • 김남규;이동훈;최호창
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.471-492
    • /
    • 2017
  • 최근 데이터의 양 자체가 해결해야 할 문제의 일부분이 되는 빅데이터(Big Data) 분석에 대한 수요와 관심이 급증하고 있다. 빅데이터는 기존의 정형 데이터 뿐 아니라 이미지, 동영상, 로그 등 다양한 형태의 비정형 데이터 또한 포함하는 개념으로 사용되고 있으며, 다양한 유형의 데이터 중 특히 정보의 표현 및 전달을 위한 대표적 수단인 텍스트(Text) 분석에 대한 연구가 활발하게 이루어지고 있다. 텍스트 분석은 일반적으로 문서 수집, 파싱(Parsing) 및 필터링(Filtering), 구조화, 빈도 분석 및 유사도 분석의 순서로 수행되며, 분석의 결과는 워드 클라우드(Word Cloud), 워드 네트워크(Word Network), 토픽 모델링(Topic Modeling), 문서 분류, 감성 분석 등의 형태로 나타나게 된다. 특히 최근 다양한 소셜미디어(Social Media)를 통해 급증하고 있는 텍스트 데이터로부터 주요 토픽을 파악하기 위한 수요가 증가함에 따라, 방대한 양의 비정형 텍스트 문서로부터 주요 토픽을 추출하고 각 토픽별 해당 문서를 묶어서 제공하는 토픽 모델링에 대한 연구 및 적용 사례가 다양한 분야에서 생성되고 있다. 이에 본 논문에서는 텍스트 분석 관련 주요 기술 및 연구 동향을 살펴보고, 토픽 모델링을 활용하여 다양한 분야의 문제를 해결한 연구 사례를 소개한다.

비공학도를 위한 X-ray 영상촬영 시스템 해상력 평가 방법 (An Evaluation Method of X-ray Imaging System Resolution for Non-Engineers)

  • 우정은;이용금;배석환;김용권
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제35권4호
    • /
    • pp.309-314
    • /
    • 2012
  • Digital Radiography(DR) 시스템은 임상현장에서 아날로그 시스템을 대체하고 널리 이용되고 있다. DR을 이용하여 얻어진 X선 영상의 해상력을 결정짓는 요소에는 이용되는 검출기의 고유 해상력, 피사체의 대조도 및 특성, X선 선질, X선원의 산란, DR 검출기의 성능, X선 변환효율 및 초점의 크기, 피사체의 움직임 등이 있다. DR 검출기를 구성하는 요소에는 X선 포획 요소, 커플링 요소, 정보수집 요소가 있는데 이들은 시스템의 성능에 영향을 미치며, 그 성능은 해상력으로 평가된다. 의료영상 시스템의 해상력은 촬영대상물의 조직 간의 해부학적 영상을 구분하는 능력을 나타낸다. 해상력 평가를 위해 Modulation Transfer Function(MTF)이 보편적으로 이용되고, MTF는 입력 공간주파수 성분에 대한 출력 공간주파수 성분의 비를 나타내는데, 수학적으로 MTF는 Point Spread Function(PSF) 입력에 대한 시스템의 주파수 응답이며 Edge Phantom을 이용한 결과 영상에서 추출된 Line Spread Function(LSF)을 Fourier Transform하면 얻을 수 있다. 일반적으로 임상현장에서 의료영상시스템의 이용 및 관리의 책임은 방사선사가 맡고 있지만, MTF를 측정하기 위해서는 공학적, 수학적 기초 및 C, Fortran, Matlab등의 프로그램 작성 능력이 필요하기 때문에 비 공학도는 정확한 측정이 불가능하다. 의료영상 시스템의 성능 관리 및 최상의 상태를 유지하기 위해 시스템의 성능평가가 이뤄져야 하는데, 이를 위해 본 연구에서는 비공학도가 해상력 성능평가를 할수 있도록 ImageJ 및 Excel을 이용하여 해상력 평가를 할 수 있도록 방법을 제시하고, 제안된 방법을 이용해 계산된 결과와 프로그래밍을 이용해 계산된 결과의 비교를 통해 본 논문에서 제시하는 방법의 유용성을 확인하였다.

초고압전자현미경에 의한 엽육세포 색소체 미세구조의 3차원적 분석 (Three-Dimensional Analysis of the Mesophyll Plastids Using Ultra High Voltage Electron Microscopy)

  • 김인선;박상찬;한성식;김은수
    • Applied Microscopy
    • /
    • 제36권3호
    • /
    • pp.217-226
    • /
    • 2006
  • 발달중인 Sedum 및 Salsola의 엽육조직을 chemical fixation과 high pressure freezing (HPF) 등으로 고정한 후, 초박 및 후박절편으로 제작 carbon coating하여 TEM 및 UHVEM으로 연속절편에 의한 2-D영상과 tilt image data를 수집하였다. 이후 초미세 구조들에 대하여 tilting 및 tomography 기법, 그리고 디지털화한 image의 3-D 입체구조 재구현에 필수적인 IMOD 프로_그램을 적용한 image 처리과정을 거쳐 UHVEM data에서 색소체내 초미세구조의 정보를 추출하여 세포수준에서의 3-D image를 분석하였다. 색소체 기질에서 녹말입자 및 틸라코이드에 인접하여 형성되는 CAM및 $C_4$ 식물 색소체 결정체들은 어떤 막으로도 둘러싸이지 않는 구조로서, Sedum rotundifolium 색소체내 결정체는 수 ${\mu}m$에 이르는 커다란 크기로 형성된다. 결정체 내에는 약 20nm격자거리로 이루어진 기원을 알 수 없는 수백-수천 개의 미세소관성 요소들이 평행 또는 격자상태로 정교한 구조를 이루며, 티라코이드 및 녹말입자와 인접하여 발달하였다. $C_4$ 광합성 수행 Salsola komarovii의 경우, 결정체는 엽육세포 색소체에서만 발달하며 결정체 구성 기본요소들이 비교적 규칙적인 격자거리를 이루며 수십 개 배열하는 구조를 형성하였다. 특히, tilted image및 3-D 입체구조 연구에서 결정체 형성에는 이들과 인접하여 발달하는 틸라코이드막이 관여함을 알아 낼 수 있었다. 이는 엽육세포 색소체에는 결정체들이 식물이 수행하는 광합성 유형에 따라 각기 다른 구성요소로 형성되어 Sedum의 경우와 같이 발달 중인 엽육조직에서 분화하거나 Salsola에서와 같이 세포 유형에 따라 상이하게 발달하는 것으로 추정되었다.

감정예측모형의 성과개선을 위한 Support Vector Regression 응용 (Application of Support Vector Regression for Improving the Performance of the Emotion Prediction Model)

  • 김성진;유은정;정민규;김재경;안현철
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.185-202
    • /
    • 2012
  • 오늘날 정보사회에서는 정보에 대한 가치를 인식하고, 이를 위한 정보의 활용과 수집이 중요해지고 있다. 얼굴 표정은 그림 하나가 수천개의 단어를 표현할 수 있듯이 수천 개의 정보를 지니고 있다. 이에 주목하여 최근 얼굴 표정을 통해 사람의 감정을 판단하여 지능형 서비스를 제공하기 위한 시도가 MIT Media Lab을 필두로 활발하게 이루어지고 있다. 전통적으로 기존 연구에서는 인공신경망, 중회귀분석 등의 기법을 통해 사람의 감정을 판단하는 연구가 이루어져 왔다. 하지만 중회귀모형은 예측 정확도가 떨어지고, 인공신경망은 성능은 뛰어나지만 기법 자체가 지닌 과적합화 문제로 인해 한계를 지닌다. 본 연구는 사람들의 자극에 대한 반응으로서 나타나는 얼굴 표정을 통해 감정을 추론해내는 지능형 모형을 개발하는 것을 목표로 한다. 기존 얼굴 표정을 통한 지능형 감정판단모형을 개선하기 위하여, Support Vector Regression(이하 SVR) 기법을 적용하는 새로운 모형을 제시한다. SVR은 기존 Support Vector Machine이 가진 뛰어난 예측 능력을 바탕으로, 회귀문제 영역을 해결하기 위해 확장된 것이다. 본 연구의 제안 모형의 목적은 사람의 얼굴 표정으로부터 쾌/불쾌 수준 그리고 몰입도를 판단할 수 있도록 설계되는 것이다. 모형 구축을 위해 사람들에게 적절한 자극영상을 제공했을 때 나타나는 얼굴 반응들을 수집했고, 이를 기반으로 얼굴 특징점을 도출 및 보정하였다. 이후 전처리 과정을 통해 통계적 유의변수를 추출 후 학습용과 검증용 데이터로 구분하여 SVR 모형을 통해 학습시키고, 평가되도록 하였다. 다수의 일반인들을 대상으로 수집된 실제 데이터셋을 기반으로 제안모형을 적용해 본 결과, 매우 우수한 예측 정확도를 보임을 확인할 수 있었다. 아울러, 중회귀분석이나 인공신경망 기법과 비교했을 때에도 본 연구에서 제안한 SVR 모형이 쾌/불쾌 수준 및 몰입도 모두에서 더 우수한 예측성과를 보임을 확인할 수 있었다. 이는 얼굴 표정에 기반한 감정판단모형으로서 SVR이 상당히 효과적인 수단이 될 수 있다는 점을 알 수 있었다.

엔터프라이즈 환경의 연구비 통합관리 데이터 웨어하우스 개발 프로세스 (Integrated Management Data Warehouse Development Process of Research Expenses in Enterprise Environment)

  • 최성만;유철중;장옥배
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.183-194
    • /
    • 2004
  • 기존의 연구비 관리업무는 예산계획, 예산편성 및 예산정산 부분으로 관리됨으로써 여러 가지 문제점이 발생되었다. 이러한 문제점을 해결하고 연구비의 안정적인 확보와 효율적인 운영 및 투명한 집행을 위하여 연구비의 통합관리가 절실하게 요구되고있는 실정이다. 최근의 이러한 추세를 반영하여 기존의 시스템 통합업체(Inmon, IBM)의 데이터 웨어하우스 개발 프로세스에 대해서 연구한 결과 Inmon의 데이터 웨어하우스 개발 프로세스에서는 고전적인 개발주기 기법으로 단계적이며 순차적인 접근방법을 이용한다. 이로 인해 개발단계에서 중복되어지는 부분이 나타나게 되어 각 단계의 진행과정에서 그 이전단계로 피드백이 요청되는 심각한 문제를 유발하게 된다. 또한, IBM의 데이터 웨어하우스 개발 프로세스에서는 개발 프로세스가 수행되는 동안 기능과 데이터가 분리되어 어떤 기능이 데이터를 참조하고 수정하는지 안기 어려운 문제점이 발생되었다. 따라서, 된 논문에서는 이러한 문제점들을 해결하고자 계획 덴 분석단계, 설계단계, 구현 및 시험단계에서 UML을 적용한 엔터프라이즈 환경의 연구비 통합관리 데이터 웨어하우스 개발 프로세스를 제안하였다. 본 논문에서는 기존의 예산계획 DB, 예산편성 DB, 예산정산 DB의 데이터를 이용하여 사용자가 인하는 정보를 찾아주는 역할을 정보검색 에이전트에서 수행한다. 또한, 정보통합 에이전트에서는 정보검색 에이전트에서 수집한 데이터를 추출, 전송, 가공, 로딩 하여 통합 데이터베이스에 저장한다. 결과적으로, 정보통합 에이전트에서는 다수의 정보소스를 사용자가 하나하나 접근하여 검사하는 노력을 줄여주고 사용자에게 불필요하다고 판단되는 데이터를 걸러주는 역할을 수행한다. 이러한 결과로 사용자의 요구사항을 최대한 반영하여 연구비 관리정책의 수립에 필요한 다양한 형태의 의사결정 지원정보를 제공할 수 있도록 하였다. 최종 사용자에게는 원하는 분석정보를 신속하게 접근하여 단편적인 관점보다는 종합적인 관점에서 다양한 분석자료를 제공받을 수 있도록 하였다. 또한, 3개의 시스템을 하나로 통합한 결과 데이터의 공유, 시스템 통합, 운영비용 절감, 의사결정 지원환경을 단순화시키는 효과를 제공하였다.

기계경비시스템 이용자의 안전욕구충족과 이용만족 및 생활만족의 관계 (Relationship among User's Security Need Sufficiency, Customer Satisfaction and Life Satisfaction in Electronic Security System)

  • 김찬선
    • 한국콘텐츠학회논문지
    • /
    • 제9권7호
    • /
    • pp.257-267
    • /
    • 2009
  • 본 연구는 기계경비시스템 이용자의 안전욕구충족과 이용만족 및 생활만족의 관계를 규명하는데 있다. 이 연구는 2008년 6월 20일부터 7월 15일까지 25일간에 걸쳐 서울 소재 기계경비시스템 이용자들을 모집단으로 집락화하여 각 지역에 1개동을 추출하고 80명씩 총 400부를 배부하여 378명을 유의표집 하였다. 최종분석에 사용된 사례 수는 302명이다. 수집된 자료는 SPSSWIN 16.0올 이용하여 요인분석, 신뢰도분석, 단계별 다중회귀분석, 경로분석 등의 방법을 활용하였다. 결론은 다음과 같다. 첫째, 신체적 환경적 심리적 정보적 물리적 안전욕구가 높을수록 신변 재산보호 시설이용 만족은 높다. 그리고 신체적 환경적 심리적 안전욕구가 높을수록 직원서비스 만족은 높다. 둘째, 신체적 환경적 정보적 물리적 안전욕구가 높을수록 일상생활, 안전생활 만족은 높다. 셋째, 신변 재산보호 시설이용 직원서비스 만족이 높을수록 안전생활 만족은 높다. 또한 직원서비스 신변 재산보호 만족이 높을수록 일상생활 만족은 높다. 넷째, 안전욕구충족은 생활만족에 직접적으로 낮은 수준에서 영향을 미치지만, 기계경비시스템 이용 만족을 통하여 간접적으로 생활만족에 더 크게 영향을 미친다.

기계경비시스템 이용자의 안전욕구충족과 이용만족 및 생활만족의 관계 (Relationship among User's Security Need Sufficiency, Customer Satisfaction and Life Satisfaction in Electronic Security System)

  • 김찬선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.614-619
    • /
    • 2009
  • 본 연구는 기계경비시스템 이용자의 안전욕구충족과 이용만족 및 생활만족의 관계를 규명하기 위하여 2008년 6월 20일부터 7월 15일까지 25일간에 걸쳐 서울 소재(강동 강서 강남 강북 도심권) 기계경비시스템 이용자들을 모집단으로 집락화하여 각 지역에 1개동을 추출하고 80명씩 총 400부를 배부하여 378명을 유의표집 하였다. 최종분석에 사용된 사례 수는 302명이다. 수집된 자료는 SPSSWIN 16.0을 이용하여 요인분석, 신뢰도분석, 단계별 다중회귀분석, 경로분석 등의 방법을 활용하였다. 결론은 다음과 같다. 첫째, 신체적 환경적 심리적 정보적 물리적 안전욕구가 높을수록 신변 재산보호 시설이용 만족은 높다. 그리고 신체적 환경적 심리적 안전욕구가 높을수록 직원서비스 만족은 높다. 둘째, 신체적 환경적 정보적 물리적 안전욕구가 높을수록 일상생활, 안전생활 만족은 높다. 셋째, 신변 재산보호 시설이용 직원서비스 만족이 높을수록 안전생활 만족은 높다. 또한 직원 서비스 신변 재산보호 만족이 높을수록 일상생활 만족은 높다. 넷째, 안전욕구충족은 생활만족에 직접적으로 낮은 수준에서 영향을 미치지만, 기계경비시스템 이용만족을 통하여 간접적으로 생활만족에 더 크게 영향을 미친다.

  • PDF

러프 하한 근사를 갖는 로컬 커버링 기반 규칙 획득 기법을 이용한 섬망 환자의 분류 방법 (A Classification Method of Delirium Patients Using Local Covering-Based Rule Acquisition Approach with Rough Lower Approximation)

  • 손창식;강원석;이종하;문경자
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권4호
    • /
    • pp.137-144
    • /
    • 2020
  • 섬망은 의식 장애, 주의력 장애 및 언어력 장애와 같은 일시적인 인지 장애가 있는 환자, 특히 노인에서 나타나는 가장 흔한 정신 장애 중 하나이다. 섬망은 환자와 가족에게 고통을 주고, 통증과 같은 증상의 관리를 방해할 수 있으며 노인 사망률 증가와 관련이 있다. 본 논문의 목적은 장기 요양 시설에서 섬망 환자를 구별하는데 사용될 수 있는 유용한 임상적 지식을 생성하는데 있다. 이러한 목적을 위해, 러프 하한 근사 영역을 갖는 로컬 커버링 규칙 기법을 활용하여 섬망과 관련된 임상적 분류 지식을 추출하였다. 제안된 방법의 임상적 적용 가능성은 전향적 코호트 연구로부터 수집된 데이터를 활용하여 확인하였다. 연구 결과, 섬망 기간이 12일 이상 지속될 수 있는 6가지 유용한 임상적 증거를 발견하였고, 체질량 지수, 동반질환 지수, 입원경로, 영양결핍, 감염, 수면박탈, 욕창, 기저귀 사용과 같은 8가지 인자들이 섬망 결과를 구별하는 데 중요한 요인이라는 것을 확인하였다. 제안된 방법의 분류 성능은 통계적 5-겹 교차검정 방법을 사용하여 3가지 벤치마킹 모델, 즉 ANN, RBF 커널 함수를 활용한 SVM, 랜덤 포레스트와 비교하여 검증하였다. 제안된 방법은 3가지 모델 중 가장 높은 성능을 제공한 SVM 모델과 비교했을 때 정확도와 AUC 기준에서 평균 0.6%와 2.7% 개선된 성능을 보였다.

감마선 검출기를 위한 스펙트럼 분석 소프트웨어 개발 (Development of a Spectrum Analysis Software for Multipurpose Gamma-ray Detectors)

  • 이종명;김용권;박길순;김정민;이기성;정진훈
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제33권1호
    • /
    • pp.51-59
    • /
    • 2010
  • NaI(Tl) 섬광 결정과 광전자 증배관를 결합한 형태의 감마선 검출기는 감도와 개발비용 면에서 우수하여 일반적으로 환경 감시용 검출기에 잘 활용된다. 본 연구에서는 보다 조작이 용이하고 다목적으로 활용할 수 있는 지능형 감마선 검출기와 연동되어 동위원소 자동인식이 가능한 분석 소프트웨어를 개발하였다. 개발된 소프트웨어는 크게 네트워크 인터페이스 모듈과 스펙트럼분석 모듈, 그리고 그래픽 유저 인터페이스 모듈의 세부분으로 나누어진다. 이중 핵심부분은 스펙트럼분석모듈로서 네트워크를 통해 수집된 신호로부터 해당 동위원소에 대한 에너지스펙트럼의 피크정보를 추출하고 이를 토대로 입력 동위원소의 종류를 판별해 내는 것이다. 일반적으로 채널과 에너지의 관계는 근사적으로 선형적인 함수관계가 있으므로 피크 정보를 정확히 얻어내면 해당 동위원소의 인식이 가능하다. 본 연구에서 개발된 피크 검출 알고리듬은 두 개의 피크를 가진 표준 동위원소에 대한 라이브러리 구축 및 이를 기준으로 한 미지의 동위원소에 대한 자동인식을 수행하도록 개발되었다. 대상 하드웨어인 뉴캐어메디컬시스템의 GammaPro 1410을 사용하여 연동 실험을 수행한 결과 하나의 미지의 선원에 대한 인식률을 측정할때 1% 이내의 피크 검출오차를 기록하였다. 또한 효율적인 네트워크 연동모듈의 설계를 통하여 세계 수준인 200K CPS의 데이터 처리속도를 달성하였다. 감마선 검출기와 본 소프트웨어에 더하여 선량분석 알고리듬에 대한 개발이 이어진다면 실시간 지능형 검출시스템으로서 의료기관 및 발전소, 연구시설 등 폭넓은 분야에 활용될 것으로 기대된다.

통합보안관리 에이전트를 확장한 웹 어플리케이션 공격 탐지 연구 (A Study of Web Application Attack Detection extended ESM Agent)

  • 김성락
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.161-168
    • /
    • 2007
  • 웹에 대한 공격은 웹 서버 자체의 취약점 보다 웹 어플리케이션의 구조, 논리, 코딩상의 오류를 이용한다. OWASP에서 웹 어플리케이션 취약점을 10가지로 분류하여 발표한 자료에 의하면 웹 해킹의 위험성과 피해가 심각함을 잘 알 수 있다. 이에 따라 웹 해킹에 대한 탐지능력 및 대응이 절실히 요구된다. 이러한 웹 공격을 방어하기 위해 패턴 매칭을 이용한 필터링을 수행하거나 코드를 수정하는 방법이 있을 수 있지만 새로운 공격에 대해서는 탐지 및 방어가 어렵다. 또한 침입탐지시스템이나 웹 방화벽과 같은 단위보안 제품을 도입할 수 있지만 운영과 지속적인 유지를 위해서는 많은 비용과 노력이 요구되며 많은 탐지의 오류를 발생한다. 본 연구에서는 웹 어플리케이션의 구조와 파라미터 입력 값에 대한 타입, 길이와 같은 특성 값들을 추출하는 프로파일링 기법을 이용하여 사전에 웹 어플리케이션 구조 데이터베이스를 구축함으로서 사용자 입력 값 검증의 부재에 대한 해결과 비정상적인 요청에 대해 데이터베이스의 프로파일 식별자를 이용하여 검증하고 공격 탐지가 가능하다. 통합보안관리시스템은 현재 대부분 조직에서 도입하여 운영하고 있으며 일반화 되어있다. 그래서 통합보안관리시스템의 보안 감사 로그 수집 에이전트에 웹 어플리케이션 공격 탐지 기능을 추가한 모델을 제시함으로서 추가 단위보안제품을 도입하지 않고서도 웹 어플리케이션 공격을 탐지할 수 있도록 하였다.

  • PDF