• 제목/요약/키워드: distributed system concept

검색결과 294건 처리시간 0.021초

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

곡성 동악산 청류구곡(淸流九曲)의 형태 및 의미론적 특성 (Characteristic on the Layout and Semantic Interpretation of Chungryu-Gugok, Dongaksan Mountain, Gokseong)

  • 노재현;신상섭;허준;이정한;한상엽
    • 한국전통조경학회지
    • /
    • 제32권4호
    • /
    • pp.24-36
    • /
    • 2014
  • 동악산 청류구곡 일원은 아름다운 계류를 따라 와폭(臥瀑)과 담(潭), 소(沼), 대(臺) 등의 암반경관과 성리문화의 전형으로 향유되어온 구곡문화가 실증적으로 대입된 사례로, 1872년 곡성현 지방도에서 "삼남제일암반계류 청류동(三南第一巖盤溪流 淸流洞)"으로 명기된 바와 같이 풍치가 탁월한 승경처임을 보여준다. 경물(景物)과 경구(警句)가 육로와 수로에 쌍으로 설정되어 차별성을 갖는 청류구곡은 일제강점기인 1916년 이전, 정순태와 조병순의 주도로 설정된 것으로 판단되지만 성리학자들은 물론 불교지도자, 독립운동가 등 선현들의 장구처 등이 다수 발견되는 것으로 볼 때 오래전부터 명인(名人)들의 산수탐방과 은일처로 활용된 것으로 추정된다. 도림사계곡의 기반암 암상에 구성된 청류구곡은 산지형 하천으로 총 길이 약 1.2km, 평균 곡거리 149m로 국내 여타 구곡에 비해 짧은 것으로 나타났다. 전남지역에서 유일하게 확증된 동악산 3개 구곡의 바위글씨는 총 165건으로 국내에서 가장 많은 바위글씨의 집결지로 판단된다. 특히 112개소로 집계된 청류구곡 바위글씨의 내용 분석결과, '수신(修身)'의 의미가 49점(43.8%)으로 가장 많았으며 다음으로 '인명' 21건(18.8%), '경물' 16건(14.2%), 장구처 등 장구지소' 12건(10.6%) 등이었고 '시구(詩句)'가 차지하는 비율은 6건(3.6%)으로 나타났다. 육로상의 제1곡 쇄연문과 수로상의 제9곡 제시인간별유천(除是人間別有天)은 박세화(朴世和)가 충북 제천에 설정한 용하구곡(用夏九曲)의 제1곡 홍단연쇄(虹斷烟鎖) 및 제9곡 제시인간별유천과 일치하는 것으로 동일한 시원(始原)을 갖는 구곡명으로 유추된다. 또한 육로상 제6곡 대은병(大隱屛)은 주자 무이구곡의 제7곡과 일치하는 것으로 구곡원림의 거점으로 인식되며, 7곡과 8곡 사이의 '암서재(巖棲齋)'와 '포경재(抱經齋)' 바위글씨와 석축 흔적 등은 무이구곡 은병봉 아래 무이정사와 비견되는 것으로, 기호사림의 청류동 활동거점으로 파악된다. 선사어제(鮮史御帝), 보가효우(保家孝友, 고종), 사무사(思無邪, 명나라 의종), 백세청풍(百世淸風, 주자), 청류수석 동악풍경(흥선 대원군) 등 명인들의 명구들이 망라된 동악산 구곡은 높은 유가미학적 가치를 표출함은 물론 의미론적 상징문화경관의 보고라 할 수 있다. 아울러 청류구곡은 수심양성을 위한 유가적 가치체계와 불교 및 도교적 관념 등이 공존하는 유불선(儒彿仙) 3교 문화경관의 결집체로 특성이 부각된다. 청류구곡은 최익현(崔益鉉), 전우(田愚), 기우만(奇宇萬), 송병선(宋秉璿), 황현(黃玹) 등으로 대변되는 조선 후기 사림계층이 성리학의 도통의식을 계승하고 '위정척사'와 '존왕양이(尊王攘夷)', '항일의지 고취' 등의 수단으로 설정되고 활용하는 과정에서 배태(胚胎)된 항일 역사문화 항쟁의 거점으로서 장소성과 의미론적 특성에 충일하다.

온라인 서비스 품질이 고객만족 및 충성의도에 미치는 영향 -항공권 예약.발권 웹사이트를 중심으로- (The Effects of Online Service Quality on Consumer Satisfaction and Loyalty Intention -About Booking and Issuing Air Tickets on Website-)

  • 박종기;고도은;이승창
    • 한국유통학회지:유통연구
    • /
    • 제15권3호
    • /
    • pp.71-110
    • /
    • 2010
  • 본 연구에서는 항공권 예약 발권 웹사이트의 서비스 품질을 측정 뿐만 아니라 서비스 회복도 측정하고자 하였다. 또한 서비스 품질과 서비스 회복이 고객만족 및 충성의도에 미치는 영향관계를 실증하고자 하였다. 온라인 서비스 품질과 온라인 서비스 회복의 측정을 위해 Parasuraman, Zeithaml, & Malhotra(2005)가 개발한 E-S-QUAL과 E-RecS-QUAL을 사용했으며, 했다. E-S-QUAL은 온라인 서비스 품질을 측정하는 도구로써, 효율성, 시스템 이용가능성, 이행성, 프라이버시의 4개 차원 22개 항목으로 구성된다. E-RecS-QUAL은 온라인 서비스 회복을 측정하는 도구로써, 반응, 보상, 접촉의 3개 차원 11개 항목으로 구성된다. 실증분석을 위한 설문조사는 항공사나 여행사의 웹사이트를 통해 국내 외 항공권을 구입해 본 경험이 있는 소비자를 대상으로 실시하였는데, 총 400부가 회수되었고, 이 중 342부를 최종분석에 사용하였다. 실증분석을 위해 AMOS 7.0과 SPSS 15.0을 사용하였다. 먼저, SPSS 15.0을 사용하여, 요인점수를 이용한 회귀분석으로 가설검증을 한 결과, <가설 I-1, 2, 3, 4, II-1, 2, 3, III-1, IV-1>이 전부 채택되었다. 온라인 서비스 품질과 온라인 서비스 회복의 각 차원은 모두 전반적인 서비스 품질에 유의한 영향을 보였고, 전반적인 서비스 품질은 고객만족에 유의한 영향을 미쳤다. 마지막으로 고객만족 역시 충성의도에 유의한 영향을 미치는 것으로 확인되었다. 한편 AMOS 7.0을 사용하여 모형 분석을 하였는데, 모형의 적합도는 가설검증을 하기에 합당한 수치가 나왔다. 이를 토대로 가설검증을 한 결과, <가설 I-1, 3, II-1, 3, III-1, IV-1>은 채택되었고, <가설 I-2, 4, II-2>는 기각되었다. 이 결과는 Parasuraman et al.(2005)이 주장한 것처럼 E-S-QUAL을 나타내는 데는 요인점수를 이용한 회귀분석이 더 적합하다는 것을 보여주는 것이라고 판단된다. 이를 토대로 본 연구의 시사점을 정리하였다.

  • PDF