• 제목/요약/키워드: searching method

검색결과 1,970건 처리시간 0.036초

AI 및 텍스트 마이닝 기법을 활용한 지반조사보고서 데이터 추출 자동화 (Automated Data Extraction from Unstructured Geotechnical Report based on AI and Text-mining Techniques)

  • 박지민;서완혁;서동희;윤태섭
    • 한국지반공학회논문집
    • /
    • 제40권4호
    • /
    • pp.69-79
    • /
    • 2024
  • 현장 지반정수 데이터는 다양한 현장 및 실내시험을 통해 획득된 후 지반조사보고서의 형태로 작성되어 유통된다. 효율적인 설계 및 시공을 위해선 지반정수의 디지털 데이터베이스화가 필수적이나, 현재 지반조사보고서 데이터는 수동 입력 방식으로 많은 시간과 인력이 소요되며, 오류가 발생하기도 한다. 본 연구는 이미지 기반 딥러닝 모델 및 텍스트 마이닝 기법을 사용하여 지반조사보고서에서 데이터를 자동으로 추출하는 방법을 제안하였다. 딥러닝 기반의 페이지 분류 모델과 텍스트 서칭 알고리즘을 사용하여 지반조사보고서 부록 내 세부 지반시험 결과 보고서를 100%의 정확도로 분류할 수 있었다. 컴퓨터 비전 알고리즘을 통해 보고서 페이지 내 유효한 데이터 영역을 결정하고, 텍스트 분석을 통해 추출 데이터 항목과 상응하는 지반 데이터를 짝지어 데이터를 추출했다. 제안한 모델은 205개의 지반조사 보고서로 구성된 데이터셋을 통해 검증되었으며, 평균 93.0%의 데이터 추출 정확도를 기록하였다. 마지막으로, 추출 모델의 실무 적용성을 위해 사용자 인터페이스 기반 프로그램을 개발하였다. 프로그램 내 사용자 상호작용을 통해 지반조사보고서 PDF 파일을 업로드하고 자동으로 보고서를 분석 및 데이터를 추출, 편집할 수 있도록 했다. 이를 통해 지반조사보고서의 디지털화 및 지반 데이터베이스 구축이 더욱 효율적이고 정확하게 이루어질 수 있을 것으로 판단된다.

다중 피크의 영역 성장 기법에 의한 전기영동 젤의 영상 분석 ((Image Analysis of Electrophoresis Gels by using Region Growing with Multiple Peaks))

  • 김영원;전병환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.444-453
    • /
    • 2003
  • 최근 생명공학(BT)에 대한 관심이 집중되면서, 새로운 생리활성 물질을 찾거나 유전자 정보를 분석하기 위한 목적으로 전기영동 젤의 영상 분석 기술에 대한 요구가 급증하고 있다. 이를 위해서는 젤 영상의 레인에서 각 밴드의 위치와 양을 정확히 측정해야 한다. 기존 연구에서는 주로 레인의 프로파일에서 피크를 탐색하는 접근방법을 사용하는데, 이 피크의 위치는 밴드에 있는 최대 자기 화소의 위치도 아니고 더욱이 밴드 무게중심의 위치도 아니기 때문에 밴드의 대표 위치로 인정하기 어렵다. 또한, 피크 추출을 쉽게 하기 위해 다양한 영상 향상 처리를 적용하기 때문에 밴드의 양을 측정하기에는 부적절한 경우가 많다. 본 논문에서는 영상의 상대적인 밝기를 변화시키지 않으면서 먼저 밴드의 영역을 추출한 후, 밴드 영역의 밝기 합으로 양을 구하고 이의 무게중심을 밴드 위치로 정하는 방식을 채택한다. 실제로, 먼저 젤 영상 히스토그램에 엔트로피기반 임계치를 설정하여 레인을 추출한 후, 밴드 영역 추출을 위해 서로 다른 세 가지 방법을 시도한다. 첫째, 추출된 레인을 이등분하는 중심선을 탐색하여 피크와 밸리를 찾고, 피크의 상하 밸리를 각 밴드의 최소 포함 박스영역으로 지정하는 방법(MER), 둘째, 앞의 방법에서와 같이 구한 피크를 영역 성장의 시드로 사용하여 이웃하는 밴드와의 중첩을 해결하면서 밴드 영역을 추출하는 방법(RG-1), 셋째, 이와 달리 레인을 삼등분하는 두 탐색선에서 피크를 찾고 동일한 밴드에 속하는 피크 쌍을 결정한 후 영역을 성장하는 방법(RG-2)을 제안한다. 이상의 세 방법을 비교하기 위해 밴드의 위치 및 양을 측정한 결과, 밴드 위치의 평균 오차는 레인의 길이를 단위 크기로 정규화 할 때, MER 방법이 6%, RG-1 방법이 3%, RG-2 방법이 1%로 나타났다. 또한, 밴드 양의 평균 오차는 레인 내 밴드들의 양의 합을 단위 크기로 정규화 할 때, MER 방법이 8%, RG-1 방법이 5%, RG-2 방법이 2%로 나타났다. 결과적으로, RG-2 방법이 밴드의 위치 및 양 추출에 있어서 정확도가 가장 높은 것으로 판명되었다.

움직임 벡터의 시공간 상관성을 이용한 새로운 고속 블럭 정합 움직임 추정 방식 (New Fast Block-Matching Motion Estimation using Temporal and Spatial Correlation of Motion Vectors)

  • 남재열;서재수;곽진석;이명호;송근원
    • 방송공학회논문지
    • /
    • 제5권2호
    • /
    • pp.247-259
    • /
    • 2000
  • 본 논문은 움직임 벡터의 높은 시$\cdot$공간 상관도 정보를 이용하여 계산량을 줄이면서 움직임 추정의 정확도를 높일 수 있는 새로운 블럭 정합 움직임 추정 방식을 제안한다. 제안된 방식은 기존의 고속 움직임 추정 방식들이 이용하는 탐색 영역내의 일관된 첫 번째 탐색 위치에서 움직임 벡터를 찾는 것이 아니라 움직임 벡터의 높은 시$\cdot$공간 상관도 정보를 이용하여 보다 정확한 탐색영역을 찾아 탐색 영역을 보정함으로써 보다 정확한 첫번째 탐색 위치를 중심으로 움직임 벡터를 탐색한다. 즉, 본 논문에서 제안하는 방식의 핵심은 움직임 추정의 정확도를 높이기 위해서 보다 정확한 첫번째 탐색 위치를 찾는 것이다. 따라서 움직임 벡터의 시간적인 상관성을 이용하기 위해서 현재 프레임 블럭과 같은 좌표를 갖는 이전 프레임 블럭의 방향성을 조사한다. 또한 공간적인 상관성을 이용하기 위해서 현재 프레임내의 이웃 블럭들의 방향성을 조사한다. 이러한 블럭들이 갖는 방향성을 바탕으로 움직임 추정을 위한 첫번째 탐색 위치를 결정하게 되고 그 위치를 중심으로 일정한 탐색 패턴에 따라 움직임 벡터를 탐색하는 방식이다. 실험 결과 제안된 방식은 기존의 대표적인 고속 탐색 방식들에 비해 PSNR (Peak-to-Signal Noise Ratio) 값에 있어서 평균적으로 1.7dB 개선되고 영상에 따라 최고 3.6dB 정도 우수한 결과를 나타낸다. 또한 탐색 횟수에서는 기존의 대표적인 고속탐색 알고리즘인 3단계 탐색 알고리즘 (Three-step search algorithm) 보다 평균 50% 이상을 줄일 수 있었고, 정확한 움직임 벡터를 찾는 비교에 있어서도 월등히 우수한 결과를 나타내었다. 또한 제안된 방식은 정량적인 결과뿐만 아니라 부호화 후 복호화한 영상의 화질에 있어서도 다른 고속 탐색 알고리즘 보다 월등히 우수한 화질을 제공한다. 및 상품과율 등이 모두 10:0 양액보다 높게 나타났다. 식물체내의 무기성분은 8:2의 경우 K+ 및 Mg2+는 잎에서 Ca2+은 뿌리에서 많았으며 PO4-은 과실과 줄기에서 많았다. 10:0에서의 무기성분도 8:2에서와 같은 경향을 나타내었으며, 배지간에 무기성분의 차이는 인정되지 않았다. 양액조성에 따른 무기성분 함량의 차이는 K+, Ca2+ 및 Mg2+는 10:0에서, PO4-은 8:2에서 각각 많았다.uage. The major language of calligraphy pattern was Arabic script and often Persian script. Calligraphy pattern was composed of Kufic and Cursive script. The cursive script was developed various forms. The Islamic tenet prohibit depiction of sacred images, the sacred Arabic calligraphy such as ′Alla′ or ′Mohammad′ was substituted of them. And the content of calligraphy pattern was used with Quranic phrases. The aesthetics of Islamic patterns analyzed aesthetic of ′rhythmic lines′, aesthetic of ′unity in multiplicity′, aesthetic of tessellation and aesthetic of harmony. On the textiles of the Islamic culture, the arabesque, floral, geometric and calligraphy patterns were frequently used.의 증가를 나타냈다.". And the

  • PDF

창의적 과학방법으로서 철학의 비판적 사고: 신경철학적 해명 (The Critical Thinking of Philosophy as a Creative Method of Science: Neurophilosophical Explication)

  • 박제윤
    • 한국과학교육학회지
    • /
    • 제33권1호
    • /
    • pp.144-160
    • /
    • 2013
  • 본 논문은 '창의적 과학탐구 방법으로 철학의 비판적 사고가 어떤 기능을 하는지'를 신경학적으로 설명하려는 하나의 가설적 제안이다. 지금까지 창의적 과학연구 방법은 주로 포퍼(Popper), 쿤(Kuhn), 헴펠(Hempel), 라카토슈(Lakatos) 등 과학철학자들이 제안한 과학의 논리적 '탐구과정'과 관련된 가설적 주장들이었다. 그러한 주장들은 어떠한 연구과정 또는 접근법이 창의성을 발휘하게 하는지를 모색하게 한다. 본 연구자는 그러한 탐구 경향 혹은 접근법을 "창의성 과정 접근법(Process Approach of Creativity: PAC)"이라 부르겠다. 그러나 본 연구자의 관점에 따르면, PAC를 모색하는 연구자들은 실질적으로 창의적 이론이 어떻게 도출되는지에 관심을 두지 않는다. 반면에 본 논문은 서양에서 새로운 이론을 창안했던 과학자들의 '철학적 사고 능력'에 초점을 맞춘다. 그들은 과학 연구 이외에도 대부분 철학을 공부한 경험이 있으며, 자신의 학문에 대한 비판적 사고를 할줄 아는 학자들이었다. 본 연구자의 관점에 따르면, 철학의 비판적 사고는 자신이 갖는 (낡은) 과학이론에서 핵심적 기초 개념과 원리에 대한 회의와 의문을 제기하게 하여, 새로운 창의적 이론을 얻게 한다. 본 연구는 이것을 신경철학의 관점에서 설명하려 한다. 신경철학의 창시자인 처칠랜드 부부(Paul and Patricia Churchland)의 "상태공간 표상이론(the state space theory of representation)"의 관점에서 전망해보면, "창의적 이론"이란 새로운 포괄적 설명과 예측을 제공하는 새로운 국소 대응도(topographic maps)의 연결망이다. 그 전망에서, 철학의 비판적 질문의 태도는 낡은 국소대응도 연결망의 오류를 역전파(back-propagation) 또는 피드백(feedback)으로 수정하게 할 것이며, 따라서 새로운 대응도 연결망을 탐색하게 만들 원동력이라고 본 연구자는 가정한다. 이 가정에서, 과학자들은 특별히 비범한 창의성(extraordinary creativity)을 위해 자신의 학문적 기초 가정들을 철학적으로 돌아보는 것이 중요하다. 철학의 비판적 태도는 낡은 기초 가정들의 대응도를 흔들어 과학자들이 새로운 개념체계의 국소 대응도를 형성하도록 해주기 때문이다. 이러한 측면에서 본 연구자는 "창의성 비판적 사고 접근법(Critical Thinking Approach of Creativity: CTAC)"을 제안한다.

기독교 영아기 부모 관련 연구 분석 (Analysis of Research on Christian Infant Parents)

  • 김민정
    • 기독교교육논총
    • /
    • 제77권
    • /
    • pp.47-62
    • /
    • 2024
  • 연구 목적 : 기독교 영아기 부모 관련 연구를 연구시기, 연구내용, 연구방법으로 분석하여 기독교 영아기 부모 관련 연구과제 방향을 모색하고자 하였다. 연구 내용 및 방법 : 본 연구를 위해 1995년부터 2023년까지 출간된 국회도서관과 학술연구정보서비스(RISS)에서 국내 석·박사학위논문을 '기독교', '영아', '영아기', '부모'를 주제어로 검색하여 중복된 연구목록을 정리하여 총 40편을 추출하였다. 또한, 연구시기, 연구내용, 연구방법의 3가지 준거로 분류하고 분석하여 빈도와 백분율을 산출하였다. 결론 및 제언 : 기독교 영아기 부모 관련 연구는 2016-2020년 10편(25%)의 연구가 이루어져 다른 시기보다 기독교 영아기 부모 관련 연구가 활발하게 이루어졌다. 석사학위논문은 39편(97.5%), 박사학위논문은 1편(2.5%)으로 석사학위논문 중심으로 연구가 이루어졌다. 연구 내용에 따른 기독교 영아기 부모 관련 연구에서 실천연구는 34편(85%), 기초연구는 6편(15%)로 나타났다. 기독교 영아기 부모 관련 연구에서 부모교육 프로그램 개발, 영아용 공과교재 개발 등의 현장 관련 연구는 지속적으로 이루어졌으나, 기독교 영아기 부모 관련 이론, 철학, 인식 및 실태 조사 연구가 부족하였다. 연구 방법에 따른 기독교 영아기 부모 관련 연구에서 문헌연구 27편(67.5%), 양적연구 10편(25%), 질적연구 3편(7.5%)으로 문헌연구 중심으로 연구가 이루어졌다. 2016-2020년에 양적연구, 질적연구, 문헌연구가 다양하게 이루어졌다. 연구결과를 토대로 장기적 관점으로 기독교 유아기와 아동기 부모 연구, 관찰 및 면담으로 이루어진 심층적 질적연구, 단일연구를 보완할 수 있는 혼합연구 방법의 기독교 영아기 부모 관련 연구가 이루어져야 한다.

소셜 뉴스를 위한 시간 종속적인 메타데이터 기반의 컨텍스트 공유 프레임워크 (Context Sharing Framework Based on Time Dependent Metadata for Social News Service)

  • 가명현;오경진;홍명덕;조근식
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.39-53
    • /
    • 2013
  • 인터넷의 발달과 SNS의 등장으로 정보흐름의 방식이 크게 바뀌었다. 이러한 변화에 따라 소셜 미디어가 급부상하고 있으며 소셜 미디어와 비디오 콘텐츠가 융합된 소셜 TV, 소셜 뉴스의 중요성이 강조되고 있다. 이러한 환경 속에서 사용자들은 단순히 콘텐츠를 탐색만 하는 것이 아니라 같은 콘텐츠를 이용하고 있는 친구들이나 지인들과 콘텐츠에 대한 정보나 경험들을 공유하고 더 나아가 새로운 콘텐츠를 만들어내기도 한다. 하지만 기존의 소셜 뉴스에서는 이러한 사용자들의 특성을 반영해 주지 못하고 있다. 특히 이용자들의 참여성만을 고려하고 있어서 서비스간의 차별화가 어렵고 뉴스 콘텐츠에 대한 정보나 경험 공유 시 컨텍스트 공유가 어렵다는 문제가 있다. 이를 해결하기 위해 본 논문에서는 뉴스를 내용별로 분할하고 분할된 뉴스에서 추출된 시간 종속적인 메타데이터를 제공하는 프레임워크를 제안한다. 제안하는 프레임워크에서는 스토리 분할 방법을 이용하여 뉴스 대본을 내용별로 분할한다. 또한 뉴스 전체내용을 대표하는 태그, 분할된 뉴스를 나타내는 서브 태그, 분할된 뉴스가 비디오에서 시작하는 위치 즉, 시간 종속적인 메타데이터를 제공한다. 소셜 뉴스 이용자들에게 시간 종속적인 메타데이터를 제공한다면 이용자들은 전체의 뉴스 내용 중에 자신이 원하는 부분만을 탐색 할 수 있으며 이 부분에 대한 견해를 남길 수 있다. 그리고 뉴스의 전달이나 의견 공유 시 메타데이터를 함께 전달함으로써 전달하고자 하는 내용에 바로 접근이 가능하며 프레임워크의 성능은 추출된 서브 태그가 뉴스의 실제 내용을 얼마나 잘 나타내 주느냐에 따라 결정된다. 그리고 서브 태그는 스토리 분할의 정확성과 서브 태그를 추출하는 방법에 따라 다르게 추출된다. 이 점을 고려하여 의미적 유사도 기반의 스토리 분할 방법을 프레임워크에 적용하였고 벤치마크 알고리즘과 성능 비교 실험을 수행하였으며 분할된 뉴스에서 추출된 서브 태그들과 실제 뉴스의 내용을 비교하여 서브 태그들의 정확도를 분석하였다. 결과적으로 의미적 유사도를 고려한 스토리 분할 방법이 더 우수한 성능을 보였으며 추출된 서브 태그들도 컨텍스트와 관련된 단어들이 추출 되었다.

사례기반추론과 텍스트마이닝 기법을 활용한 KTX 차량고장 지능형 조치지원시스템 연구 (An Intelligence Support System Research on KTX Rolling Stock Failure Using Case-based Reasoning and Text Mining)

  • 이형일;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.47-73
    • /
    • 2020
  • KTX 차량은 수많은 기계, 전기 장치 및 부품들로 구성되어 있는 하나의 시스템으로 차량의 유지보수에는 상당히 많은 전문성과 유지보수 작업자들의 경험을 필요로 한다. 차량 고장발생 시 유지보수자의 지식과 경험에 따라 문제 해결의 시간과 작업의 질적 차이가 발생하며 그에 따른 차량의 가용율이 달라진다. 일반적으로 문제해결은 고장 매뉴얼을 기반으로 하지만 경험이 많고 능숙한 전문가의 경우는 이와 더불어 개인의 노하우를 접목하여 신속하게 진단하고 조치를 취한다. 이러한 지식은 암묵지 형태로 존재하기 때문에 후임자에게 완전히 전수되기 어려우며, 이를 위해 사례기반의 철도차량 전문가시스템을 개발하여 데이터화된 지식으로 바꾸려고 하는 연구들이 있어왔다. 하지만, 간선에 가장 많이 투입되고 있는 KTX 차량에 대한 연구나 텍스트의 특징을 추출하여 유사사례를 검색하는 시스템 개발은 아직 미비하다. 따라서, 본 연구에서는 이러한 차량 유지보수 전문가들의 노하우를 통해 수행된 고장들에 대한 진단과 조치 이력을 문제 해결의 사례로 활용하여 새롭게 발생하는 고장에 대한 조치가이드를 제공하는 지능형 조치지원시스템을 제안하고자 한다. 이를 위하여, 2015년부터 2017년동안 생성된 차량고장 데이터를 수집하여 사례베이스를 구축하였고, 차원축소 기법인 비음수 행렬 인수분해(NMF), 잠재의미분석(LSA), Doc2Vec을 통해 고장의 특징을 추출하여 벡터 간의 코사인 거리를 측정하는 방식으로 유사 사례를 검색하였으며, 위의 알고리즘에 의해 제안된 조치내역들 간 성능을 비교하였다. 분석결과, 고장 내역의 키워드가 적은 경우의 유사 사례 검색과 조치 제안은 코사인 유사도를 직접 적용하는 경우에도 좋은 성능을 낸다는 것을 알 수 있었고 차원 축소 기법들의 성능 비교를 통해 문맥적 의미를 보존하는 차원 축소 방식 중 Doc2Vec을 적용하는 것이 가장 좋은 성능을 나타낸다는 것을 알 수 있었다. 텍스트 마이닝 기술은 여러 분야에서 활용을 위한 연구들이 이루어지고 있는 추세이나, 본 연구에서 활용하고자 하는 분야처럼 전문적인 용어들이 다수이고 데이터에 대한 접근이 제한적인 환경에서 이러한 텍스트 데이터를 활용한 연구는 아직 부족한 실정이다. 본 연구는 이러한 관점에서 키워드 기반의 사례 검색을 보완하고자 텍스트 마이닝 기법을 접목하여 고장의 특징을 추출하는 방식으로 사례를 검색해 조치를 제안하는 지능형 진단시스템을 제시하였다는 데에 의의가 있다. 이를 통해 현장에서 바로 사용 가능한 진단시스템을 단계적으로 개발하는데 기초자료로써 시사점을 제공할 수 있을 것으로 기대한다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.

타임스탬프를 갖는 이벤트 시퀀스의 인덱스 기반 검색 (Index-based Searching on Timestamped Event Sequences)

  • 박상현;원정임;윤지희;김상욱
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.468-478
    • /
    • 2004
  • 시퀀스 데이타베이스로부터 원하는 질의 패턴과 일치하는 모든 서브 시퀀스를 검색하는 것은 데이타 마이닝이나 바이오 인포매틱스 등 응용 분야에서 필수적인 연산이다. 예를 들어, 특정한 이벤트가 발생할 때마다 이벤트의 유형과 발생 시각을 기록하는 네트웍 이벤트 관리 시스템에서 네트웍 이벤트들의 연관 관계를 발견하기 위한 전형적인 질의 형태는 다음과 같다: 'CiscoDCDLinkUp이 발생한 후 MLMStatusUP과 TCPConnectionClose가 각각 20초 이내와 40초 이내에 순차적으로 발생하는 모든 경우를 검색하라.' 본 논문에서는 대규모 이벤트 시퀀스 데이타베이스를 대상으로 하여 위와 같은 질의를 효율적으로 처리할 수 있는 인덱싱 방법을 제안한다. 기존의 방법들이 비효율적인 순차적 검색이나 페이지화 하기 어려운 인덱스 구조에 의존하는데 반하여, 제안하는 방법은 저장 및 검색 효율이 입증된 다차원 공간 인덱스를 사용하여 질의를 만족하는 모든 서브 시퀀스를 착오 기각(false dismissal) 없이 신속하게 검색한다. 다차원 공간 인덱스의 입력은 이벤트 시퀀스 데이타베이스 상의 슬라이딩 윈도우 내에서 각 이벤트 유형이 최초로 발생한 시각을 기록한 n 차원 벡터가 된다. 여기서 n은 발생 가능한 이벤트 유형의 수이다. n이 큰 경우는 차원 저주(dimensionality curse) 문제가 발생할 수 있으므로 차원 선택이나 이벤트유형 그루핑을 이용하여 차원을 축소한다. 실험 결과에 의하면 제안된 방법은 순차적 검색이나 ISO-Depth 인덱스 기법에 비하여 몇 배에서 몇 십 배의 성능 향상 효과를 갖는 것으로 나타났다. 것으로 나타났다.예측치가 비교적 유사한 것으로 나타났으며, 평균 절도오차도 10% 수준이었다.HNP 처리구에서 가장 많았던 것으로 나타났다. 지상부 식생에 대한 총 양분함량은(N+P+K+Ca+Mg) 리기다소 나무가 703kg/ha 그리고 낙엽송이 869kg/ha였다.여 주었다.능성을 시도하였고, 그 결과는 다음과 같다. 1. Cholesterol을 제거한 cheese의 제조에서 최적조건은 균질압력 1200psi(70kg$cm^2$), 균질온도 $70^{\circ}$, $\beta$-cyclodextrin 첨가량 2%였으며, 이때 우유의 cholesterol의 제거율이 86.05%로 가장 높게 나타났다. 2. Cholesterol을 제거한 cheese들의 수율은 모두 12.53%(control 10.54%) 이상으로 균질 처리가 cheese의 수율을 18.88%이상 향상시키는 것으로 나타났다. 3. 유지방 함량 23.80%인 control 치즈의 cholesterol 함량은 81.47mg/100g이었고, 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 2%를 첨가한 cheese에서는 cholesterol 함량이 20.15mg/100g으로 cholesterol 제거율이 75.27%로 가장 높게 나타났다. 4. Meltability는 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 1과 2%로 처리한 치즈에서 2.25cm(control 3.34cm)로 가장 낮았으며,

블로그(Blog)를 통해 본 2013순천만국제정원박람회에 대한 인식 (The Implication and Recognition of International Garden Exposition Suncheon Bay Korea 2013 on Blogs)

  • 장민지;최정민
    • 한국조경학회지
    • /
    • 제42권4호
    • /
    • pp.60-75
    • /
    • 2014
  • 본 연구의 목적은 블로거들이 전달하는 2013순천만국제정원박람회에 대한 정보와 소감을 통해 관람객들의 인식(認識)을 파악함으로써 국제정원박람회장의 활용이나 유사한 계획에 유용한 시사점을 도출하고자 하는 것이다. 연구는 인터넷 포털사이트에서 순천만국제정원박람회를 키워드로 검색하여 나타난 상위 300건의 블로그를 대상으로 하였다. 블로거들은 2013순천만국제정원박람회의 특정 정원이나 공간에 대한 인상과 선호를 그 이유와 함께 가감 없이 기술하고 있어 관람객들의 인식을 선명하게 포착할 수 있었다. 연구 결과는 다음과 같다. 첫째, 세계 정원에 대한 선호는 네덜란드정원, 한국정원, 중국정원, 프랑스정원 순이었다. 전반적으로 세계 정원에 대한 만족도는 높지 않았고, 실망감을 구체적으로 표현한 블로거들이 많았다. 둘째, 참여 정원에 대한 인지도가 낮은 것으로 나타났다. 참여 정원은 새로운 소재와 실험적인 디자인을 통해 정원 예술을 소개하는 정원박람회 본래의 취지를 대변하는 장소로서 보다 중시할 필요가 있다고 생각한다. 셋째, 많은 블로거들이 세부 경관과 일시적 경관 같은 미시 경관에서 깊은 인상을 받는 것으로 나타났다. 박람회장 같은 넓은 대상지에서도 미시 경관은 중요한 경관 체험 요소로 중시되어야 한다는 것을 시사한다. 넷째, 관람객들은 '순천호수정원'과 '꿈의 다리'를 가장 인상적인 장소로 인식하고 있었다. 이들은 2013순천만국제정원박람회의 아이콘이자 대표 경관이기도 하지만 세계 정원과 참여 정원에 대한 인식 약화의 원인이기도 한 것으로 나타났다. 다섯째, 대부분의 관람객들은 입장료가 "비싸다"고 인식하고 있었다. 우리 사회가 비용을 지불하고, 정원을 관람하는 것에 대한 인식이 아직 정립되지 않은 것으로 이해할 수 있다. 정원 문화에 대한 인식 제고를 위해 더 많은 노력이 필요하다는 것을 시사한다. 전반적으로 블로거들은 2013순천만국제정원박람회에 대해 만족감을 표현하지만, 실망한 점이나 개선 사항과 같은 비판적 인식을 구체적으로 나타내는 블로거들도 많았다. 이러한 비판적 의견은 유용한 시사점을 제공하고 있다. 이런 측면에서 블로거는 '시민 비평가'라고 할 수 있고, 블로그는 일반들의 '격식 없는 담론의 장'이라고 할 수 있다. 인식 조사 방법으로써 블로그는 주관적이고 개인적이라 해석에 어려움이 있고, 자료를 정량화하여 분석하는 데에는 비록 한계점이 있지만, 다양하고 구체적인 인식을 포착할 수 있는 통로이기도 하다. 블로그의 이러한 측면은 향후 박람회장 활용이나 유사 프로젝트의 계획을 위한 인식 조사의 유용한 방법이 될 수 있을 것으로 전망한다.