• 제목/요약/키워드: Dynamic Similarity

검색결과 266건 처리시간 0.025초

비정형 텍스트 분석을 활용한 이슈의 동적 변이과정 고찰 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2016
  • 최근 가용한 텍스트 데이터 자원이 증가함에 따라 방대한 텍스트 분석을 통해 새로운 가치를 창출하고자 하는 수요가 증가하고 있다. 특히 뉴스, 민원, 블로그, SNS 등을 통해 유통되는 글로부터 다양한 이슈를 발굴해내고 이들 이슈의 추이를 분석하는 이슈 트래킹에 대한 연구가 활발하게 이루어지고 있다. 전통적인 이슈 트래킹은 토픽 모델링을 통해 오랜 기간에 걸쳐 지속된 주요 이슈를 발굴한 후, 각 이슈를 구성하는 문서 수의 세부 기간별 분포를 분석하는 방식으로 이루어진다. 하지만 전통적 이슈 트래킹은 각 이슈를 구성하는 내용이 전체 기간에 걸쳐 변화 없이 유지된다는 가정 하에 수행되기 때문에, 다양한 세부 이슈가 서로 영향을 주며 생성, 병합, 분화, 소멸하는 이슈의 동적 변이과정을 나타내지 못한다. 또한 전체 기간에 걸쳐 지속적으로 출현한 키워드만이 이슈 키워드로 도출되기 때문에, 핵실험, 이산가족 등 세부 기간의 분석에서는 매우 상이한 맥락으로 파악되는 구체적인 이슈가 오랜 기간의 분석에서는 북한이라는 큰 이슈에 함몰되어 가려지는 현상이 발생할 수 있다. 본 연구에서는 이러한 한계를 극복하기 위해 각 세부 기간의 문서에 대한 독립적인 분석을 통해 세부 기간별 주요 이슈를 도출한 후, 각 이슈의 유사도에 기반하여 이슈 흐름도를 도출하고자 한다. 또한 각 문서의 카테고리 정보를 활용하여 카테고리간의 이슈 전이 패턴을 분석하고자 한다. 본 논문에서는 총 53,739건의 신문 기사에 제안 방법론을 적용한 실험을 수행하였으며, 이를 통해 전통적인 이슈 트래킹을 통해 발굴한 주요 이슈의 세부 기간별 구성 내용을 살펴볼 수 있을 뿐 아니라, 특정 이슈의 선행 이슈와 후행 이슈를 파악할 수 있음을 확인하였다. 또한 카테고리간 분석을 통해 단방향 전이와 양방향 전이의 흥미로운 패턴을 발견하였다.

기술적(技術的) 효율성(效率性)의 결정요인(決定要因)과 동태적(動態的) 변화(變化) (Technical Efficiency in Korea: Interindustry Determinants and Dynamic Stability)

  • 유승민
    • KDI Journal of Economic Policy
    • /
    • 제12권4호
    • /
    • pp.21-46
    • /
    • 1990
  • 본 논문은 유승민(劉承旻) 이인찬(李仁燦)(1990)이 추정한 우리나라 제조업(製造業)의 기술적(技術的) 효율성(效率性)을 토대로 기술적(技術的) 효율성(效率性)의 산업적(産業的) 격차(隔差)를 설명하는 경험적 증거를 구하고 효율성 추정치의 동태적(動態的) 안정성(安定性)을 분석하였다. 분석결과 산업(産業)의 생산규모(生産規模)가 클수록, 생산특화도(生産特化度)가 높을수록, 자본(資本)-노동비율(勞動比率)의 이질성(異質性)이 낮을수록 높은 기술적(技術的) 효율성(效率性)을 나타내었다. 이러한 결과는 미국(美國) 일본(日本)의 경우에 대한 연구결과와 공통되는 것으로서 기술적(技術的) 효율성(效率性)과 산업조직특성간(産業組織特性間)의 관계가 경제규모나 발전단계의 차이에도 불구하고 가설(假說)의 일반성(一般性)을 지지한다는 점에서 중요한 의미를 지닌다. 기업집중률(企業集中率) 또한 기술적 효율성에 대하여 선형(線型)보다는 이차형(二次型)의 관계를 가지고 있으나 우리나라의 경우 기술적 효율성이 극대화되는 집중률(集中率)은 매우 높은 것으로 나타났다. 또한 본 논문은 효율성(效率性) 척도간(尺度間)의 선택문제에 대한 경험적 기준을 제시하였는데 부가가치액기준(附加價値額基準)보다는 생산액기준(生産額基準)으로 추정된 기술적(技術的) 효율성(效率性)이 제가설(諸假說)들과 잘 부합되는 결과를 나타내었다. 효율성의 동태적(動態的) 안정성(安定性)에 관한 시론적(試論的) 분석(分析)에 의하면 시간변화에 따른 효율성 추청치의 안정성은 효율성 척도간에 다소의 차이는 있으나 기대한 만큼 높지 않았다. 따라서 기술적 효율성의 동태적(動態的) 불안전요인(不安全要因)에 관한 설명은 연구과제로 남는다.

  • PDF

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

모형 정치망의 흐름에 대한 거동 (Dynamic Behavior of Model Set Net in the Flow)

  • 정기철;권병국;이주희
    • 수산해양기술연구
    • /
    • 제33권4호
    • /
    • pp.275-284
    • /
    • 1997
  • 우리 나라 남해안 연안에 부설된 소형정치망을 실험 수조의 크기 등을 고려하여 그 의 1/50의 크기로 Tauti의 어구 비교법칙에 따라 모형어구를 제작하여 유향 R(원통에서 헛통방향으로).L(헛통에서 원통방향으로)방향과 각각의 유속에 따라 그물 형상의 변화, 각 뜸의 침하량, 멍줄 장력의 변화 들을 측정, 관찰한 결과를 요약하면 다음과 같다. 1. 그물형상의 변화는 유향 R의 경우 유속 0.2m/sec에서 헛통 끝그물이 조하쪽으로 20mm, 상방으로 10mm 이동어구 전체가 바닥으로부터 부상하였고, 유속 0.6m/sec에서는 원통에서 헛통 까지 거의 일직선을 이루었다. 유향 L의 경우는, 상방으로 18mm 이동하여 어구 전체가 바닥으로부터 부상하였고, 유속 0.5m/sec이상에서는 헛통에서 원통까지 거의 일직선을 이루었다. 2. 긱 뜸의 침하량은 유향 R의 경우 머리뜸은 유속 0.2m/sec부터 서서히 침하하시 시작하여, 유속 0.3m/sec에서는 20mm 정도 침하하고, 유속 0.6m/sec에서는 99mm 정도 침하하였다. 그러나, 끝뜸은 유속 0m/sec부터 0.6m/sce까지 침하하지 않고 약간의 요동만 일으켰다. 유향 L의 경우 끝뜸은 유속 0.1m/sec에서부터 서서히 침하하기 시작하여, 0.2m/sec에서는 5mm정도 침하하였고, 0.6m/sec에서는 108mm 정도 침하하였으며, 0.5m/sec에서 머리뜸만 남기고 어구전체가 수몰되기 시작하였다. 3. 멍줄 장력의 변화는 유향 R의 경우 머리뜸 멍줄에 작용한 장력은 유속 0.1m/sec에서 273.51g이며, 0.6m/sec에서는 1298.40g 정도로 증가하였다. 유향 L의 경우 한쪽 끝뜸줄에 걸리는 장력은 유속 0.1m/sec에서 137.08g이며, 0.6m/sec에서 646.00g 정도로 증가하였다. 멍중 장력의 분포는 유속의 증대와 함게 유향 RL 향 모두 조상측 멍줄에 집중하여 나타났으며, 다른 멍줄에는 현저한 장력의 증가는 관측되지 않았다.되지 않았다.

  • PDF

스토리 기반의 정보 검색 연구 (Story-based Information Retrieval)

  • 유은순;박승보
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.81-96
    • /
    • 2013
  • 웹의 발전과 콘텐츠 산업의 팽창으로 비디오 데이터가 폭발적으로 증가함에 따라 데이터의 정보 검색은 매우 중요한 문제가 되었다. 그동안 비디오 데이터의 정보 검색과 브라우징을 위해 비디오의 프레임(frame)이나 숏(shot)으로부터 색채(color)와 질감(texture), 모양(shape)과 같은 시각적 특징(features)들을 추출하여 비디오의 내용을 표현하고 유사도를 측정하는 내용 기반(content-based)방식의 비디오 분석이 주를 이루었다. 영화는 하위 레벨의 시청각적 정보와 상위 레벨의 스토리 정보를 포함하고 있다. 저차원의 시각적 특징을 통해 내용을 표현하는 내용 기반 분석을 영화에 적용할 경우 내용 기반 분석과 인간이 인지하는 영화의 내용 사이에는 의미적 격차(semantic gap)가 발생한다. 왜냐하면 영화의 스토리는 시간의 진행에 따라 그 내용이 변하고, 관점에 따라 주관적 해석이 가능한 고차원의 의미정보이기 때문이다. 따라서 스토리 차원의 정보 검색을 위해서는 스토리를 모델링하는 정형화된 모형이 필요하다. 최근 들어 소셜 네트워크 개념을 활용한 스토리 기반의 비디오 분석 방법들이 등장하고 있다. 그러나 영화 속 등장인물들의 소셜 네트워크를 통해 스토리를 표현하는 이 방법들은 몇 가지 문제점들을 드러내고 있다. 첫째, 등장인물들의 관계에만 초점이 맞추어져 있으며, 스토리 진행에 따른 등장인물들의 관계 변화를 역동적으로 표현하지 못한다. 둘째, 등장인물의 정체성과 심리상태를 보여주는 감정(emotion)과 같은 심층적 정보를 간과하고 있다. 셋째, 등장인물 이외에 스토리를 구성하는 사건과 배경에 대한 정보들을 반영하지 못하고 있다. 따라서 본 연구는 기존의 스토리 기반의 비디오 분석 방법들의 한계를 살펴보고, 문제 해결을 위해 문학 이론에서 제시하고 있는 서사 구조에 근거하여 스토리 모델링에 필요한 요소들을 인물, 배경, 사건의 세 가지 측면에서 제시하고자 한다.

휴대폰 기지국 정보를 이용한 O/D 추정기법 연구 (Origin-Destination Estimation Based on Cellular Phone's Base Station)

  • 김시곤;유병석;강승필
    • 대한교통학회지
    • /
    • 제23권1호
    • /
    • pp.93-102
    • /
    • 2005
  • 통행기종점(Origin-Destination)은 경로 선택 및 통행 배정 등 교통계획 측면에서 중요한 정보 중 하나이다. O/D 예측은 대부분 현장 조사나 가구 면접조사를 통하여 표본 O/D를 산출하고 이를 전수화하는 것이 전통적인 방법이고, 가로 교통량과 통행배정모형과의 상호관계 속에서 동적 O/D를 추정하고자 하는 연구도 있다. 그러나, 최근에는 휴대폰 보급의 괄목할만한 증대에 따라 휴대폰 정보를 이용하여 O/D를 추정하는 연구에 관심이 기울어지고 있다. 본 연구에서는 휴대폰 기지국 정보를 이용한 O/D 추정 방법론을 제시하고, 휴대폰 기지국 기반 O/D를 행정동 기반 O/D로 변환하는 방법론을 제시한다. 연구를 위해 청주시에서 운행중인 택시에 GPS 장비 및 휴대폰 거치대를 설치하여 GPS 위치 좌표, 휴대폰 기지국 좌표를 수집하였고, 이중 3주간의 자료를 디지털 맵에 맵매칭시켜 기지국 위치 기반 O/D와 GPS 위치 기반 O/D를 산출하였다. GPS 위치 기반 O/D를 이용하여 주간 O/D 통행패턴, 주중 O/D와 주말 O/D 통행패턴, 일평균 O/D와 오전${\cdot}$오후 첨두시 O/D 통행패턴 사이의 관계를 산점도 및 상관계수로부터 유추한 견과, 주중 O/D와 주말 O/D간에는 통행패턴의 차이가 있으며, 오전 첨두시와 오후 첨두시의 통행패턴 역시 차이가 아는 것을 확인할 수 있었다. 휴대폰 기지국 기반 O/D를 행정동 기반 O/D화하는 방법으로 GPS 분포비를 이용한 방법과 기지국 커버리지 면적비를 이용한 방법을 제시하였으며, 두 방법 모두 참 O/D라 생각할 수 있는 GPS 위치 기반 O/D와 크게 다르지 않은 것을 상관계수, 평균절대오차율(MAE), 제곱근 평균제곱오차(RMSE)를 통하여 확인하였다. 향후 휴대폰 정보만을 이용하는 경우에는 휴대폰 기지국 커버리지 면적비를 이용하는 방법을 이용하면 O/D를 추정할 수 있을 것으로 판단된다. 또한 현재의 표본 택시 O/D를 전수화하는 방법도 제시하였다.