• 제목/요약/키워드: 문서검색

검색결과 1,719건 처리시간 0.025초

효율적인 인터넷 대역폭 사용을 위한 웹 프리페칭 기법 (Web Prefetching Scheme for Efficient Internet Bandwidth Usage)

  • 김숙향;홍원기
    • 한국정보과학회논문지:정보통신
    • /
    • 제27권3호
    • /
    • pp.301-314
    • /
    • 2000
  • World Wide Web(이하 웹)은 저렴한 가격과 다양하고 흥미 있는 정보를 쉽고 간편하게 찾아볼 수 있다는 장점으로 웹의 사용자는 하루가 다르게 증가되고 있으며 웹의 사용자의 증가와 함께 웹을 통해 전달되는 데이터 즉, 웹 문서, 그림, 멀티미디어 데이터 등의 크기 또한 빠르게 증가되고 있다. 웹 트래픽을 위한 네트워크 대역폭의 사용량을 살펴보면 사용자들의 요청이 많은 peak periods에는 대부분의 대역폭을 사용하고 있고, off-peak periods에는 사용하지 않는 대역폭이 존재한다. 지금까지 네트워크의 대역폭 소비량을 감소시키고, 검색 지연시간을 줄이기 위해 많은 연구가 이루어졌고 그 해결방안 중 하나가 웹 캐싱이다. 그러나, 웹 캐싱을 사용하더라도 peak periods 동안에는 네트워크 대역폭의 사용량을 감소시키기에는 한계가 있으며 off-peak periods에 여유 있는 네트워크 대역폭을 효율적으로 사용할 수 업사. 본 논문에서는 네트워크 대역폭을 균형 있게 사용하기 위해 캐싱 서버(SQUID)를 기반으로 하는 웹 프리페칭(Web prefetching)기법을 제안한다. 24시간 동안의 웹 사용 상황을 분석하여, 가장 많이 사용되면서 다음 24시간 내에 유효기간을 초과하는 웹 객체를 프리페칭하는 방법을 사용한다. 제안된 웹 프리페칭 기법은 peak periods 동안 요청되리라 예상되는 웹 객체를 off-peak periods 동안 남는 대역폭을 이용하여 미리 캐싱 서버에 가져다 놓은 방법으로써 많은 디스크 용량을 요구하지 않으면서도 캐시 객체 히트율을 높일 수 있다. 또한 사용자들의 웹 접근 패턴을 기반으로 하기 때문에 프리페칭된 웹 객체에 대하여 높은 객체 히트율을 보인다. 본 논문에서 소개한 기법의 유효성 시뮬레이션을 통해서 증명하였다. 시뮬레이션 결과는 본 논문에서 제안된 프리페칭 기법이 효율적으로 peak bandwidth를 줄일 수 있다는 것을 나타낸다.

  • PDF

빅데이터 분석을 통한 무인계산대 사용자 경험에 관한 연구 (A study on the User Experience at Unmanned Checkout Counter Using Big Data Analysis)

  • 김애숙;정선미;류기환;김희영
    • 문화기술의 융합
    • /
    • 제8권2호
    • /
    • pp.343-348
    • /
    • 2022
  • 본 연구는 SNS 빅데이터를 활용하여 소비자들이 인지하는 무인계산대에 대한 사용자 경험을 분석하고자 한다. 이 연구를 위하여 네이버(NAVER)와 다음(Daum)에서 블로그, 뉴스, 지식인, 카페, 지식인(팁), 웹 문서를 대상으로 분석하였고 자료 검색을 위한 키워드는 '무인계산대'를 사용하였다. 자료 분석 기간을 2020년 1월1일부터 2021년 12월 31일까지 2년으로 선정하였다. 자료수집 및 분석을 위해서는 텍스톰(TEXTOM)을 통하여 빈도 및 매트릭스 데이터를 추출하였고 UCINET 6 프로그램의 NetDraw 기능을 이용해 네트워크 분석과 시각화 분석을 실시하였다. 그 결과 무인계산대는 소비자들의 경험요소 정의에 따라 접근성, 사용성, 지속사용의도, 기타로 군집화하였다. 공급자 측면에서 최저임금 인상과 근로시간 단축에 따른 문제를 해결하기 위해 무인계산대가 무분별하게 확산된다면 사회적 관점에서 더 큰 고용문제가 발생할 것이다. 아울러 무인계산에 익숙하지 않은 노인과 젊은 세대, 어린이, 외국인 등을 위해 쉽고 편리한 무인계산대 보급을 위한 제도화가 필요하다.

키워드 출현 빈도 분석과 CONCOR 기법을 이용한 ICT 교육 동향 분석 (Analysis of ICT Education Trends using Keyword Occurrence Frequency Analysis and CONCOR Technique)

  • 이영석
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.187-192
    • /
    • 2023
  • 본 연구는 기계학습의 키워드 출현 빈도 분석과 CONCOR(CONvergence of iteration CORrealtion) 기법을 통한 ICT 교육에 대한 흐름을 탐색한다. 2018년부터 현재까지의 등재지 이상의 논문을 'ICT 교육'의 키워드로 구글 스칼라에서 304개 검색하였고, 체계적 문헌 리뷰 절차에 따라 ICT 교육과 관련이 높은 60편의 논문을 선정하면서, 논문의 제목과 요약을 중심으로 키워드를 추출하였다. 단어 빈도 및 지표 데이터는 자연어 처리의 TF-IDF를 통한 빈도 분석, 동시 출현 빈도의 단어를 분석하여 출현 빈도가 높은 49개의 중심어를 추출하였다. 관계의 정도는 단어 간의 연결 구조와 연결 정도 중심성을 분석하여 검증하였고, CONCOR 분석을 통해 유사성을 가진 단어들로 구성된 군집을 도출하였다. 분석 결과 첫째, '교육', '연구', '결과', '활용', '분석'이 주요 키워드로 분석되었다. 둘째, 교육을 키워드로 N-GRAM 네트워크 그래프를 진행한 결과 '교육과정', '활용'이 가장 높은 단어의 관계로 나타났다. 셋째, 교육을 키워드로 군집분석을 한 결과, '교육과정', '프로그래밍', '학생', '향상', '정보'의 5개 군이 형성되었다. 이러한 연구 결과를 바탕으로 ICT 교육 동향의 분석 및 트렌드 파악을 토대로 ICT 교육에 필요한 실질적인 연구를 수행할 수 있을 것이다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

한국 기록관리행정의 변천과 전망 (Records Management and Archives in Korea : Its Development and Prospects)

  • 남효채
    • 한국기록관리학회지
    • /
    • 제1권1호
    • /
    • pp.19-35
    • /
    • 2001
  • 조선왕조의 기록관리 전통의 맥이 끊어진지 거의 한세기가 지난 1999년도에 한국은 "공공기관의 기록물관리에 관한 법률"을 제정 시행함으로써 기록관리의 새로운 시대를 맞이했다. 조선왕조실록에는 국사 전반에 걸쳐 오백년 간의 중요한 역사적 사실들이 기록되었다. 이것은 인류역사상 주요한 업적이며 전세계적으로 귀한 사례이다. 이것이 가능했던 것은 실록이 누대(累代)의 사관들이 저술하고 편찬한 일차자료인 기록물을 수집, 선정한 것이기 때문이다. 근대적 기록보존소에서는 중요한 공공기록물이 원형대로 보존될 필요가 있기 때문에 기록보존을 위해 중요한 국가 기록물을 평가 선별하는 근대적 기록보존제도를 확립해야 했다. 그러나 일제에 의한 식민지화로 그 기회를 빼앗겼고 우리의 훌륭한 기록보전 전통은 계승되지 못했다. 중앙화된 기록보존제도는 1969년 총무처에 정부기록보존소를 설립함으로써 발전하기 시작했다. 정부기록보존소는 조선왕조의 사고 전통을 계승해서 1984년 부산에 현대적 사고시설을 건축했다. 1998년 정부기록보존소는 대전정부종합청사로 본부를 이전하고 첨단 시청각기록물 서고를 갖추었다. 1996년부터 정부기록보존소는 마이크로필름 보존을 보완하고 수작업 등록시스템을 개선하기 위하여 기록물 관리시스템 전산화를 도입했다. 소장 기록물의 디지털화는 이용자에게 디지털 이미지를 제공하기 위한 주요한 사업이었다. 이를 위해 정부기록보존소는 새로 컴퓨터/서버 시스템을 구입하고 응용 소프트웨어를 개발했다. 이와 병행하여 정부기록보존소는 역사학 및 문헌정보학 배경을 가진 아키비스트들을 증원하여 고도의 전문화를 이루는 방향으로 인력구조를 크게 혁신하였다. 보존연구직과 전산직 역시 채용되었다. 새로운 기록물관리법은 2000년 1월 1일부터 시행되고 있다. 이 법은 한국의 기록물관리에 있어 다음과 같은 변화를 가져왔다. 첫째, 이 법은 입법 사법 행정부, 헌법기관, 육해공군, 국가정보원 등 모든 공공기관의 기록물을 규정한다. 범국가적으로 통일된 기록물관리체계가 갖추어지게 되었다. 둘째, 각 기관의 수준별로 공공기록물 관리 기관을 두게 되었다. 중앙기록물관리기관, 국회 및 사법부에 특수기록물관리기관, 대도시 및 도에 지방기록물 관리기관, 공공기관에 자료관 또는 특수자료관, 각 과단위에서는 기록물관리책임자가 기록관리를 책임지게 되었다. 셋째, 공공기관의 기록물은 생산시에 컴퓨터에 등록된다. 따라서 인터넷이나 컴퓨터망을 통해 기록물을 쉽게 추적, 검색할 수 있게 될 것이다. 넷째, 기록관리학 분야에서 전문적 훈련을 받은 기록물관리 전문요원 배치를 의무화함으로써 기록물의 전문적 관리를 보장하게 된다. 다섯째, 공공기록물의 불법적 처리는 처벌을 받을 수 있는 범죄를 구성한다. 앞으로 공공기록물관리는 한국정부의 '전자정부 추진정책'과 함께 발전할 것이다. 다음과 같은 변화가 예상된다. 첫째 공공기관에서는 전자결재 문서 외에 종이문서, 시청각기록물, 간행물 등도 모두 디지털화하여 행정의 효율화 및 생산성을 제고할게 될 것이다. 둘째, 국회는 이미 특수기록관을 설립하였다. 법원과 국가정보원도 뒤를 따를 것이다. 시도 차원에서 더 많은 기록관들이 설립될 것이다. 셋째, 우리 사회가 지식정보사회화 될수록 기록관리기능은 더욱 중요한 국가기능이 될 것이다. 더 많은 대학교, 학회, 시민단체들이 기록보존에 고한 인식제고에 참여하고, 기록보존운동이 범국민적 차원으로 심화될수록 한국의 기록물관리는 현재보다 눈에 띄게 발전할 것이다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

대북경제제재의 효과성과 미래 발전 방향에 대한 고찰: 해상대북제재를 중심으로 (An Analysis on the Conditions for Successful Economic Sanctions on North Korea : Focusing on the Maritime Aspects of Economic Sanctions)

  • 김상훈
    • Strategy21
    • /
    • 통권46호
    • /
    • pp.239-276
    • /
    • 2020
  • 유엔 안전보장이사회(UNSC, United Nations Security Council) 주도의 경제제재는 초창기 '포괄적 경제제재(comprehensive sanctions)' 모델에서 '스마트 경제제재(smart sanctions)' 모델로 발전하고 있다. 유엔 안보리는 직접적인 무력개입(military intervention)보다 규범적 비용(normative costs)과 부담이 덜한 경제제재를 통해 대상 국가의 손익계산법(cost-benefit calculation)을 바꿔 행동변화를 이끌어내려고 했으나, '포괄적 경제제재'에 따른 비용 대부분이 일반 대중에게 전가되면서, 인도적 위기(humanitarian crisis) 사태를 초래하고, 대상 국가의 내부 결속력을 강화하는 역설적인 상황을 만들었다. 이에 따라 정책 결정 과정에 직접적으로 관여하는 지도자와 정치 엘리트를 대상으로 자산을 동결(asset freeze)하거나 여행금지(travel ban) 조치 등을 집중적으로 하는 '스마트 제재'가 탄생하였다. 대북한 경제제재 또한 '스마트 경제제재' 모델로 점차 발전하여 그 효과성을 나타내고 있다. 특히 최근의 결의안(resolutions)을 통해 석탄 수출을 전면 금지하고, 원유 수입을 제한함에 따라 지표상 가시적인 성과가 나타나고 있고, 2018년부터 한국, 미국과 평화협상에 나서면서 제재완화를 촉구하는 등, 위와 같은 '스마트' 대북제재가 북한의 행동변화를 이끌어내고 있음을 알 수 있다. 대북제재의 효과성은 북한의 대외무역규모(total trade volume) 변화량을 통해 측정할 수 있는데, '포괄적 경제제재'의 성격에 가까운 초기의 대북제재 결의안 채택 이후에는 북한 대외무역규모가 감소한 경우도 있지만 도리어 증대된 경우도 있었다. 그러나 석탄 수출 금지 및 원유 수입 제한 조치를 담은 2016, 2017년의 결의안 이후에는 북한 대외무역규모가 2016년 약 65억 달러에서 2017년 약 55억 달러로, 2018년에는 약 28억 달러로 대폭 감소한 사실을 발견할 수 있다. 북한의 대외무역은 정권의 자금줄과 같기 때문에 대외무역규모의 감소는 곧 '스마트 제재'의 효과와 같다. 대북경제제재의 효과성에 영향을 미치는 두 번째 조건은 중국의 대북제재 레짐(sanctions regime)에의 참여 여부다. 북한은 경제적으로 중국에 상당히 의존하고 있고, 이는 지표상으로도 명백히 나타나고 있다. 중국은 그 동안 북한의 지정학적인 가치 및 급변 사태 시 북-중 국경에서의 대규모 난민 발생 우려 등에 따라 직간접적으로 북한을 지지해왔지만, 북한 핵능력의 고도화에 따른 동북아시아 지역에서의 핵확산(nuclear proliferation) 우려, 미-중 무역분쟁에 따른 여파 등으로 대북제재 레짐에 성실히 참여할 것을 밝혔다. 실제로 중국의 대북한 석유 수출량이 감소하고, 북-중간 대외무역 총량 또한 2016년부터 지속적으로 감소하며, 대북경제제재에 중국의 참여가 제재 성공의 중요한 변수임을 증명했다. 효과적인 대북제재를 위한 마지막 요건은 북한의 경제제재 회피 노력 방지(prevention of North Korea's economic sanctions evasion efforts)다. 앞서 밝힌 바와 같이 석탄 수출과 원유 수입은 북한 정권의 자금줄이자 핵무력 고도화를 위한 필수 에너지원이다. 중국이 대북제재 레짐에의 참여를 선언한 상태에서 중국으로부터의 원유 수입량이 급감함에 따라 중동지역 등지로부터 바닷길을 통해 원유를 수입해야 하는데, 원유 수입량 제한에 따라 동중국해(East China Sea) 및 공해(high seas)상에서 선박 대 선박간 불법 환적(ship-to-ship illegal transshipment)을 실시하면서 대북제재를 무력화하고 있다. 유엔 대북제재위 산하 전문가 패널(Panel of Experts), 미 국무부(U.S. Department of State), 미 재무부 외부자산통제국(U.S. Department of the Treasury's Office of Foreign Assets Control, OFAC) 등은 보고서를 통해 북한의 해상 불법 환적 실태를 상세히 밝히고 있는데, 자동 선박 식별 장치(AIS, Automatic Identification System)의 허위 신호 송출(false signaling), 선박 등록 문서 위조(false certificate of registry)와 같은 방식으로 감시 및 단속을 회피하고 있는 실정이다. '스마트'한 대북제재 설계 및 중국의 참여로 대북제재가 북한의 행동 변화를 이끌어낼 수 있음이 확인되었지만, 국제사회의 눈을 피해 해상에서 만연하고 있는 불법 환적과 같은 행위는 효과적인 대북제재 실행의 마지막 퍼즐이라고 할 수 있다. 앞으로 해상에서의 불법 환적 행위를 막기 위해 다음 세 가지 정책적 함의를 도출해낼 수 있다. 첫 번째는 가장 강력한 조치라고 할 수 있는 해상봉쇄(maritime blockade)에 대한 고려다. 전세계 물동량의 40%가 지나가는 말라카 해협(Malacca Strait)은 북한에게도 중요한 해상 교통로이다. 북한이 계속해서 결의안을 위반하고 공해상에서 불법 환적 행위를 자행할 경우, 말라카 해협에서 북한과 연계된 의심 선박을 검문 검색하고 차단(interdiction)하여 강제적인 방식으로 북한의 제재 회피 노력을 근절할 수 있다. 남중국해(South China Sea)에서 중국과 미국 간, 중국과 주변국 간 갈등이 격화됨에 따라 다국적군의 말라카 해협 봉쇄는 중국에게 달갑지 않겠지만, 유엔 대북제재 결의안에 명시되어 있는 의심 선박에 대한 검문 검색 행위임을 명백히 함과 동시에 다자간의 협조를 바탕으로 하여 규범적 정당성(normative justification)을 높인다면 충분히 실현 가능한 방안이다. 두 번째는 공해상에서의 불법 해상 환적에 대한 감시 강화와 증거 수집이다. 마지막 세번째는 대한민국의 다국적 해상 감시 활동에의 참여다. 북한의 대북제재 이행 여부는 한국의 안보와 직결되는 사안이다. 대북제재의 최종 목표는 북한 비핵화에 있고, 협상 테이블에 북한을 이끌어내는 데 제재가 효과적이라는 것이 드러났기 때문에 핵 위협의 당사자인 대한민국 또한 효과적인 제재 이행 여부 감시에 책임감을 가져야 한다.

기록 생애주기 관점에서 본 기록관리 메타데이터 표준의 특징 분석 (Feature Analysis of Metadata Schemas for Records Management and Archives from the Viewpoint of Records Lifecycle)

  • 백재은;스기모토 시게오
    • 한국기록관리학회지
    • /
    • 제10권2호
    • /
    • pp.75-99
    • /
    • 2010
  • 인터넷과 컴퓨터의 발전으로 다양한 환경이 끊임없이 제공되고, 이로 인해 대량의 디지털 리소스가 축적, 발신되고 있다. 이는 다양한 문제를 가져왔고, 우리는 디지털 리소스를 미래에 이용가능하도록 지속하고 보존하기 위한 기본적인 문제에 직면하게 되었다. 디지털 리소스를 장기간 보존하기 위해서는 리소스에 적합한 보존 방침과 방법이 필요하고, 따라서 여러 스탠다드가 개발되고 사용되어지고 있다. 메타데이터는 디지털 리소스를 장기간 유지하기 위한 디지털 아카이브에서 가장 중요한 구성요소 중 하나 이다. 디지털 리소스의 아카이빙과 보존을 위해 사용되는 메타데이터는 많이 있다. 그러나 각각의 스탠다드 는 주된 어플리케이션에 따라 각각의 특징을 가지고 있다. 이는 각각의 스키마가 특정한 어플리케이션에 따라 적절하게 선택하고 맞춰지지 않으면 안 되는 것을 의미한다. 경우에 따라서는DCMI의 어플리케이션 프레임워크와 METS와 같이, 스키마는 거대한 프레임워크와 컨테이너 메타데이터로 결합되어 있다. 다양한 메타데이터가 있는 가운데, 본 논문에서는 아카이브를 행하기 위해 용이되어 있는 메타데이터 스키마로, 공문서 혹은 행정문서등의 아카이브를 위해 기술하고 있는 ISAD(G), 디지털 리소스를 위해 작성된 EAD, 보존한 디지털 리소스를 위해 메타데이터 프레임워크를 정의하고 있는 OAIS, 디지털 리소스의 보존을 위한 PREMIS, 그리고 리소스의 관리와 검색을 위해 작성된 AGLS Metadata를 사용하여, '보존해야 되는 리소스에 하나의 메타데이터만을 선택해서 이용한다면 어떠한 문제가 생기는 가'라고 하는 의문을 바탕으로 접근하였다. 본 논문은 기록 생애주기 모델을 기초로, 스탠다드의 특징분석을 통해서 알게 된 메타데이터 스탠다드의 특징을 보여주고 있다. 특징은 이들 스탠다드의 메타데이터 기술요소가 기록 생애주기에서의 작업(task)에 관련하는 것을 간단하게 단일의 프레임워크로 보여줬다. 메타데이터 기술요소의 상세한 분석을 통해서, 우리는 기술 생애주기의 단계와 기술요소 간의 관계의 관점에서부터 스탠다드의 특징을 확실하게 할 수 있었다. 메타데이터 스키마간의 매핑은 다른 스키마가 기록 생애주기에서 사용되기에 장기 보존과정에 있어 자주 요구된다. 따라서 이러한 스키마의 상호운용성을 향상시키기 위해서는 통일된 프레임워크를 구축하는 것이 중요하다. 이 연구에서는 디지털 아카이빙과 보존에 사용되는 다른 메타데이터 스키마의 상호운용성을 기초로 제시한다.

온라인 언급이 기업 성과에 미치는 영향 분석 : 뉴스 감성분석을 통한 기업별 주가 예측 (Influence analysis of Internet buzz to corporate performance : Individual stock price prediction using sentiment analysis of online news)

  • 정지선;김동성;김종우
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.37-51
    • /
    • 2015
  • 인터넷 기술의 발전과 인터넷 상 데이터의 급속한 증가로 인해 데이터의 활용 목적에 적합한 분석방안 연구들이 활발히 진행되고 있다. 최근에는 텍스트 마이닝 기법의 활용에 대한 연구들이 이루어지고 있으며, 특히 문서 내 텍스트를 기반으로 문장이나 어휘의 긍정, 부정과 같은 극성 분포에 따라 의견을 스코어링(scoring)하는 감성분석과 관련된 연구들도 다수 이루어지고 있다. 이러한 연구의 연장선상에서, 본 연구는 인터넷 상의 특정 기업에 대한 뉴스 데이터를 수집하여 이들의 감성분석을 실시함으로써 주가의 등락에 대한 예측을 시도하였다. 개별 기업의 뉴스 정보는 해당 기업의 주가에 영향을 미치는 요인으로, 적절한 데이터 분석을 통해 주가 변동 예측에 유용하게 활용될 수 있을 것으로 기대된다. 따라서 본 연구에서는 개별 기업의 온라인 뉴스 데이터에 대한 감성분석을 바탕으로 개별 기업의 주가 변화 예측을 꾀하였다. 이를 위해, KOSPI200의 상위 종목들을 분석 대상으로 선정하여 국내 대표적 검색 포털 서비스인 네이버에서 약 2년간 발생된 개별 기업의 뉴스 데이터를 수집 분석하였다. 기업별 경영 활동 영역에 따라 기업 온라인 뉴스에 나타나는 어휘의 상이함을 고려하여 각 개별 기업의 어휘사전을 구축하여 분석에 활용함으로써 감성분석의 성능 향상을 도모하였다. 분석결과, 기업별 일간 주가 등락여부에 대한 예측 정확도는 상이했으며 평균적으로 약 56%의 예측률을 보였다. 산업 구분에 따른 주가 예측 정확도를 통하여 '에너지/화학', '생활소비재', '경기소비재'의 산업군이 상대적으로 높은 주가 예측 정확도를 보임을 확인하였으며, '정보기술'과 '조선/운송' 산업군은 주가 예측 정확도가 낮은 것으로 확인되었다. 본 논문은 온라인 뉴스 정보를 활용한 기업의 어휘사전 구축을 통해 개별 기업의 주가 등락 예측에 대한 분석을 수행하였으며, 향후 감성사전 구축 시 불필요한 어휘가 추가되는 문제점을 보완한 연구 수행을 통하여 주가 예측 정확도를 높이는 방안을 모색할 수 있을 것이다.