• 제목/요약/키워드: Feature mapping

검색결과 334건 처리시간 0.029초

Encoding Dictionary Feature for Deep Learning-based Named Entity Recognition

  • Ronran, Chirawan;Unankard, Sayan;Lee, Seungwoo
    • International Journal of Contents
    • /
    • 제17권4호
    • /
    • pp.1-15
    • /
    • 2021
  • Named entity recognition (NER) is a crucial task for NLP, which aims to extract information from texts. To build NER systems, deep learning (DL) models are learned with dictionary features by mapping each word in the dataset to dictionary features and generating a unique index. However, this technique might generate noisy labels, which pose significant challenges for the NER task. In this paper, we proposed DL-dictionary features, and evaluated them on two datasets, including the OntoNotes 5.0 dataset and our new infectious disease outbreak dataset named GFID. We used (1) a Bidirectional Long Short-Term Memory (BiLSTM) character and (2) pre-trained embedding to concatenate with (3) our proposed features, named the Convolutional Neural Network (CNN), BiLSTM, and self-attention dictionaries, respectively. The combined features (1-3) were fed through BiLSTM - Conditional Random Field (CRF) to predict named entity classes as outputs. We compared these outputs with other predictions of the BiLSTM character, pre-trained embedding, and dictionary features from previous research, which used the exact matching and partial matching dictionary technique. The findings showed that the model employing our dictionary features outperformed other models that used existing dictionary features. We also computed the F1 score with the GFID dataset to apply this technique to extract medical or healthcare information.

Examining Interaction Patterns in Online Discussion through Multiple Lenses

  • HAN, Seungyeon
    • Educational Technology International
    • /
    • 제15권2호
    • /
    • pp.117-141
    • /
    • 2014
  • This qualitative study investigated different interaction patterns in an online discussion. The data was collected from asynchronous discussion occurred in a graduate course. The data analysis methods include inductive analysis and mapping strategy. The results of the study suggest three layers of interaction: response sequences, interaction amongst participants, and concept map of messages. The visualization of response sequences enabled the researcher to discover complex and dynamic interaction patterns amongst participants. The many-to-many communication feature of online discussion does not always enable direct one-on-one interaction between two participants. Rather, one message contributed to multiple threads in the stream of conversation. In terms of interaction amongst participants, the interaction amongst participants, as indicated in the data, the messages also bind each participant and consequently a group(s) of participants together. It appears that the contribution of one message may not only enable a response to one participant, but also connect many participants to each other. The concept map of messages proposes that response sequences and interaction amongst participants can also be viewed between concepts within messages in the discussion. On the surface, the messages posted by individuals are linked by the system in a linear fashion as they are posted. However, the interaction extends to collaborative conversation amongst participants. Ultimately, a conceptual network of interrelated ideas including multiple perspectives is built in asynchronous discussion.

fMRI 데이터를 이용한 알츠하이머 진행상태 분류 (Alzheimer progression classification using fMRI data)

  • 노주현;양희덕
    • 스마트미디어저널
    • /
    • 제13권4호
    • /
    • pp.86-93
    • /
    • 2024
  • 기능적 자기 공명영상(functional magnetic resonance imaging;fMRI)의 발전은 뇌 기능의 매핑, 휴식 상태에서 뇌 네트워크의 이해에 상당한 기여를 하였다. 본 논문은 알츠하이머의 진행상태를 분류하기 위해 CNN-LSTM 기반의 분류 모델을 제안한다. 첫 번째로 특징 추출 이전 fMRI 데이터에서 잡음을 제거하기 위해 4단계의 전처리를 수행한다. 두 번째, 전처리가 끝나면 U-Net 구조를 활용하여 공간적 특징을 추출한다. 세 번째, 추출된 공간적 특징은 LSTM을 활용하여 시간적 특징을 추출하여 최종적으로 분류하는 과정을 거친다. 실험은 데이터의 시간차원을 조절하여 진행하였다. 5-fold 교차 검증을 사용하여 평균 96.4%의 정확도를 달성하였고 이러한 결과는 제안된 방법이 fMRI 데이터를 분석하여 알츠하이머의 진행을 식별하는데 높은 잠재력을 가지고 있음을 보여준다.

수치도화 프로그램 StereoCAD를 이용한 무인 항공영상의 묘사 정확도 평가 (Accuracy Assessment of Feature Collection Method with Unmanned Aerial Vehicle Images Using Stereo Plotting Program StereoCAD)

  • 이재원;김두표
    • 대한토목학회논문집
    • /
    • 제40권2호
    • /
    • pp.257-264
    • /
    • 2020
  • 현재 무인항공사진측량을 이용한 지도제작의 지형·지물 묘사는 주로 벡터화로 이루어지고 있다. 그러나 벡터화는 평면과 표고 위치를 별도로 취득하기 때문에 시간이 많이 소요되고 수치표면모델에서 표고값을 추출 할 때 과대 오차가 발생될 수 있다. 이에 3차원 공간정보를 동시에 취득가능한 수치도화의 필요성이 증가하고 있으나, 고가의 도화장비가 필요하고 무인항공영상의 수치도화 기술이 불완전한 단점이 있다. 이에 본 연구에서는 저가의 시스템으로 수치도화가 가능한 Menci사의 StereoCAD를 이용하여 지형·지물의 묘사정확도를 분석 평가하였다. 무인항공영상의 취득은 Phantom4 pro에 FC 6310 카메라를 탑재하여 비행고도 90 m에서 GSD (Ground Sample Distance) 3 cm로 촬영하였다. 정확도 분석은 검사점과 점·선·면형 레이어별 모서리에 대한 지상측량결과와 도화결과의 3차원 좌표의 차이를 산출하여 비교하였다. 그 결과 검사점의 RMSE는 평면 0.048 m, 표고 0.078 m이고, 레이어별 RMSE는 평면이 0.104~0.127 m, 표고는 0.086~0.092 m로 나타나 무인항공영상의 입체도화로 1:1,000 수치지형도 제작의 가능성을 입증할 수 있었다.

선형을 이용한 쿼터니언 기반의 3차원 점군 데이터 등록 (Registration of Three-Dimensional Point Clouds Based on Quaternions Using Linear Features)

  • 김의명;서홍덕
    • 한국측량학회지
    • /
    • 제38권3호
    • /
    • pp.175-185
    • /
    • 2020
  • 3차원 등록은 서로 다른 좌표계를 갖거나 좌표계가 없는 데이터를 기준 좌표계로 일치시키는 과정으로 사진측량의 절대표정, 정밀도로지도 제작을 위한 데이터 결합 등 다양한 분야에서 사용되고 있다. 3차원 등록은 점을 이용하는 방법과 선형을 이용하는 방법으로 구분이 된다. 점을 이용할 경우 서로 다른 공간해상도를 갖는 경우 동일한 공액점을 찾기 어려운 문제가 있다. 이에 반해 선형을 이용할 경우 공간해상도가 다른 경우 뿐만 아니라 점군 형태의 데이터에서 시작점과 끝점이 같지 않은 공액의 선형을 이용하여 3차원 등록이 가능한 장점이 있다. 본 연구에서는 선형을 이용하여 3차원 등록을 수행하기 위해서 쿼터니언을 이용하여 두 데이터 간의 3차원 회전각을 결정한 후 축척과 3차원 이동량을 결정하는 방법을 제안하였다. 제안한 방법의 검증을 위해 실내에서 구축한 선형과 실외 환경의 지상 모바일매핑시스템을 통해 취득한 선형을 이용하여 3차원 등록을 각각 수행하였다. 실험결과, 실내 데이터를 이용한 경우 축척을 고정한 경우와 고정하지 않은 경우 평균제곱근오차는 각각 0.001054m와 0.000936m로 나타났다. 실외 데이터를 이용하여 500m 구간에서 3차원 변환을 수행한 결과 6개의 선형을 이용하였을 경우 평균 제곱근오차는 0.09412m로 나타났으며 정밀도로지도 제작을 위한 정확도를 만족하는 것을 알 수 있었다. 또한, 선형의 개수를 변화시킨 실험에서 9개 이상의 선형을 이용할 경우도 평균제곱근오차의 변화가 크지 않은 것을 통해 높은 정확도의 3차원 변환을 위해 9개의 선형으로도 충분한 것을 알 수 있었다.

3차원 수치지도 생성을 위한 지형공간 데이터 모델링 (Geospatial Data Modeling for 3D Digital Mapping)

  • 이동천;배경호;유근홍
    • 한국측량학회지
    • /
    • 제27권3호
    • /
    • pp.393-400
    • /
    • 2009
  • 최근 실세계를 재현하기 위한 3차원 기술개발의 필요성과 요구가 증가하게 되어 이러한 요구를 충족하기 위해 실세계 재현에 대한 연구가 국내외적으로 활발히 진행되고 있다. 기존에 구축된 공간분석을 위한 데이터는 2차원을 목적으로 제작되었으며 이는 3차원의 현실세계를 반영하는데 한계성이 있다. 또한 데이터 활용성이 제한적이며 데이터 재생산은 비용과 시간의 측면에서 비효율적이므로 기존의 데이터를 활용하여 효과적으로 3차원의 현실세계를 재현할 수 있는 방법에 대한 연구의 필요성이 증대되었다. DEM(Digital Elevation Model: 수치표고모델)은 활용 분야별로 다양한 요구조건을 만족하는 개별적인 방법으로 제작되어 활용되며 기존의 DEM 제작은 일률적인 보간법과 해상도로 제작되므로 데이터의 효율성이 떨어진다. 이는 실세계를 반영하기 위한 정확성에서의 한계성을 가지므로 다양한 데이터를 포함하면 효율성을 높일 수 있다. 본 연구에서는 지형분석을 통해 산악지, 구릉지, 평지로 분류 하여 서로 상이한 보간법과 해상도로 다중 해상도 DEM을 생성하였고 지형의 특성을 대표하는 model keypoint 데이터를 생성하여 포함하였다. 또한 3차원 공간정보를 포함하는 데이터 융합을 위해 도화원도와 통합하여 포괄적, 적응적 및 융통적 지형공간 데이터 모델링을 방안을 제안하였다.

지형특성을 활용한 산사태 위험도 판단을 위한 비교 (A Comparison on the Identification of Landslide Hazard using Geomorphological Characteristics)

  • 차아름
    • 한국지반환경공학회 논문집
    • /
    • 제15권6호
    • /
    • pp.67-73
    • /
    • 2014
  • 토석류를 포함하는 산사태 재해는 우리나라에서 그 발생빈도가 상대적으로 큰 자연재해 중 하나이며 이로 인한 인명 및 재산피해는 매년 증가하고 있다. 이에 정부에서는 사면재해 대응 및 예방을 위한 다양한 방지대책을 추진하고 있으나, 대부분 재해발생 이후 발생지역을 중심으로 복구대책을 수립하는 것이 대부분이라 실질적인 국민의 생명과 재산을 보호하는 예방대책이라고 보기는 어렵다. 이에 본 연구는 산사태 재해 예방을 목적으로 실제 지형의 특성을 파악, 이를 위험도 평가에 활용하는 방안에 대해 알아보고자 하였다. 지형특성 분석을 위해 SINMAP(Stability INdex MAPping)과 통계적 기법인 벡터 분산을 활용하였으며 이를 실제 산사태 발생현장에 적용, 지형특성과 산사태와의 관계를 규명하고자 하였다. 분석결과는 제안한 두 가지 기법이 동일하게 위험도가 높다고 평가한 지역에서는 산사태 위험도가 상대적으로 높게 산정되었다. 이는 본 연구에서 제시한 방법이 지형특성과 산사태 위험도와의 관계성 규명에 있어 합리적임을 보여준다고 할 수 있다. 또한 실제 현장조사 결과와 비교한 산사태 위험도는 SINMAP 기법이 토석류와 같은 연속성 산사태에 있어 보다 정확하게 판단되었으나 특정요소의 위험성을 구체적으로 고려할 수 있는 기법을 추가적으로 고려한다면 보다 정확한 산사태 위험을 평가할 수 있을 것으로 사료된다.

무인항공사진측량을 이용한 벡터화의 3차원 위치정확도 분석 (Analysis of Three Dimensional Positioning Accuracy of Vectorization Using UAV-Photogrammetry)

  • 이재원;김두표
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.525-533
    • /
    • 2019
  • 무인항공사진측량을 이용한 지도제작의 지형·지물 묘사 방법에는 벡터화와 수치도화 방법이 있다. 벡터화 방법은 정사영상에서 평면위치를 추출하고, 수치표면모델(DSM: Digital Surface Model) 혹은 수치표고모델(DEM: Digital Elevation Model)에서 높이 값을 취득하고 있다. 그러나 지금까지 벡터화 성과의 정확도는 대부분 검사점만을 이용하여 분석하고 있어 지상시설물과 건물 등 3차원 지물의 위치정확도 판단이 어렵다. 이에 본 연구에서는 검사점 뿐만 아니라 지형·지물의 Layer별 모서리에 대한 정확도를 분석하여 벡터화를 이용한 3차원 공간정보취득 및 수치지도제작 가능성을 판단하고자 하였다. 촬영은 DJI사 Phantom 4 pro로 비행고도 90m에서 GSD (Ground Sample Distance) 3.6cm의 영상을 취득하였다. 연구 결과, 벡터화에 의한 묘사의 정확도는 현장측량 성과와 비교하여 검사점의 잔차를 분석한 결과 평면 RMSE (Root Mean Square Error)가 0.045m로 나타나 정사영상을 이용한 1/1,000 축척의 수치지형(평면)현황도 제작이 가능할 것으로 판단된다. 반면 전주, 옹벽 및 건물 등 Layer별 모서리 좌표를 기준자료와 비교하여 3차원 정확도를 분석한 결과 RMSE가 평면 0.068~0.162m, 표고 0.090~1.840m로 나타났다. 따라서 벡터화로 취득한 3차원 성과의 표고위치에서 오차가 크게 발생하여 벡터화를 이용한 3차원 공간정보 취득 및 1/1,000 수치지도제작이 어려운 것으로 판단된다.

디지털 영상 세포 측정법에 기반한 세포핵의 3차원 정량적 분석 (3D Quantitative Analysis of Cell Nuclei Based on Digital Image Cytometry)

  • 김태윤;최현주;최흥국
    • 한국멀티미디어학회논문지
    • /
    • 제10권7호
    • /
    • pp.846-855
    • /
    • 2007
  • 암세포 조직 영상 분석에서 유효한 특성값 추출은 암세포 등급별 분류를 위한 중요한 과정이다. 본 논문에서는 디지털 영상 세포 측정법 기반 세포핵의 3차원 정량적 분석 방법을 제안한다. 먼저 공초점 현미경을 사용하여 신세포암의 각 등급별 3차원 볼륨 데이터를 획득하고, 지도학습 방법을 기반으로 슬라이스 영상의 화소의 컬러 특성값을 이용하여 세포핵을 분할했다. 세포핵의 3차원 가시화를 위해, 윤곽선 기반 표면 렌더링과 3차원 텍스쳐 사상 방법을 이용한 볼륨 렌더링을 수행했다. 이후 세포핵의 3차원 형태학적 특성값을 정의하고 추출했다. 어떠한 3차원 특성값이 진단 정보로 유용할 것인가를 평가하기 위해, 분산 분석을 이용하여 각 등급 간 3차원 특성값의 통계적 유효성을 분석했다. 마지막으로 추출한 특성값을 2차원 특성값과 비교하고 상관관계를 분석했다. 그 결과, 세포핵 등급과 3차원 형태학적 특성값 간의 유효한 통계학적인 차이를 확인했다. 제안한 방법은 정확한 진단과 예후 추정을 위한 새로운 등급 결정 시스템 개발을 위한 기반 연구로 활용될 수 있는 가능성을 보여주었다.

  • PDF

대화형 유전자 알고리즘을 이용한 감성기반 비디오 장면 검색 (Emotion-based Video Scene Retrieval using Interactive Genetic Algorithm)

  • 유헌우;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권6호
    • /
    • pp.514-528
    • /
    • 2004
  • 본 논문에서는 감성에 기반한 장면단위 비디오 검색방법을 제안한다 먼저 특정 줄거리를 담은 장면 비디오 클립에서 급진적/점진적 샷 경계 검출 후. "평균 색상 히스토그램", "평균 자기", "평균 에지 히스토그램", "평균 샷 시간", "점진적 샷 변화율"의 5가지 특징을 추출하고, 이 특징과 사람이 막연하게 가지고 있는 감성공간과의 매핑을 대화형 유전자 알고리즘(IGA, Interactive Genetic Algorithm)을 통하여 실현한다. 제안된 검색 알고리즘은 초기 모집단 비디오들에 대해 찾고자 하는 감성을 내포하고 있는 비디오를 선택하면 선택된 비디오들에서 추출된 특징 벡터를 염색체로 간주하고 이에 대해 교차연산(crossover)을 적용한다. 다음에 새롭게 생성된 염색체들과 특징벡터로 색인된 데이타베이스 비디오들간에 유사도 함수에 의해 가장 유사한 비디오들을 검색하여 다음 세대의 집단으로 제시한다. 이와 같은 과정을 여러 세대에 걸쳐서 실행하여 사용자가 가지고 있는 감성을 내포하는 비디오 집단들을 얻게 된다 제안된 방법의 효과성을 보이기 위해, 300개의 광고 비디오 클립들에 대해 "action", "excitement", "suspense", "quietness", "relaxation", "happiness" 의 감성을 가진 비디오를 검색한 결과 평균 70%의 만족도를 얻을 수 있었다.