• 제목/요약/키워드: Text-type Index

검색결과 31건 처리시간 0.024초

서지마크 데이터베이스로부터의 색인어 추출과 색인어의 검색 활용에 관한 연구 - 경북대학교 도서관 학술정보시스템 사례를 중심으로 - (A Study on the Extraction and Utilization of Index from Bibliographic MARC Database)

  • 박미성
    • 한국도서관정보학회지
    • /
    • 제36권2호
    • /
    • pp.327-348
    • /
    • 2005
  • 본 연구의 목적은 서지정보검색시스템의 색인 정의의 중요성을 강조하고 최적 색인의 기초 자료를 마련하기 위함이다. 이를 위해 서지마크 데이터베이스로부터 색인 태그 정의 및 정규화를 통한 색인어추출이론에 대해 고찰하고, 이론에 따라 생성된 색인어의 검색 활용도를 분석하였다. 실험은 서지 2,200,488건에서 생성된 색인어 29,219,853건을 텍스트형 색인과 코드형 색인으로 나누어 이용자 왱 검색 로그에 나타난 색인 항목과 비교하여 어떤 색인 정의가 얼마나 활용되는가를 분석하였다. 결과에 따르면 서명, 저자, 출판사, 주제와 같은 텍스트형 색인어는 높은 검색 활용도를 보인 반면에 코드형 색인어는 검색 활용도가 낮아 검색에 활용되지 않는 불필요한 색인 정의들은 과감하게 제거하여 색인 정의를 최적화해야 함을 제안하였다.

  • PDF

텍스트 마이닝을 활용한 고객 리뷰의 유용성 지수 개선에 관한 연구 (A Study on Classifications of Useful Customer Reviews by Applying Text Mining Approach)

  • 이홍주
    • 한국IT서비스학회지
    • /
    • 제14권4호
    • /
    • pp.159-169
    • /
    • 2015
  • Customer reviews are one of the important sources for purchase decision makings in online stores. Online stores have tried to provide useful reviews in product pages to customers. To assess the usefulness of customer reviews before other users have voted enough on the reviews, diverse aspects of reviews were utilized in prevous studies. Style and semantic information were utilized in many studies. This study aims to test diverse alogrithms and datasets for identifying a proper classification method and threshold to classify useful reviews. In particular, most researches utilized ratio type helpfulness index as Amazon.com used. However, there is another type of usefulness index utilized in TripAdviser.com or Yelp.com, count type helpfulness index. There was no proper threshold to classify useful reviews yet for count type helpfulness index. This study used reivews and their usefulness votes on restaurnats from Yelp.com to devise diverse datasets and applied text mining approaches to classify useful reviews. Random Forest, SVM, and GLMNET showed the greater values of accuracy than other approaches.

탐구적 통합 과학 교재 개발을 위한, "FAST program"과 "중등 과학 교과서"의 탐구 활동 비교 분석 (- For the Development of Inquiring, integrated Science Curricular Materials - The Comparison and Analysis of Inquiry Activity between "The FAST Program" and "The Secondary Science Books")

  • 손연아;이학동
    • 한국과학교육학회지
    • /
    • 제14권1호
    • /
    • pp.45-57
    • /
    • 1994
  • The purpose of this study is to verify whether the FAST program is the Inquiry Science Curricular Materials, through the Comparison and Analysis of Inquiry Activities between the FAST program and our Secondary Science Books. The results of this study are as follows ; 1. FAST has 226 tasks of the Inquiry Activities, which is analyzed over two times than our text. 2. In level one, FAST holds the parts of Synthesizing Results and Evaluation, Hypothesizing and Designing an Experiment but u.ese aren't found in our text. 3. In level two, our text is analyzed No Discussion 72.2%, Demonstrating or Verifying the Content of the Text 82%, but FAST has Discussion Guided 81.8%, and isn't found any tesk of Demonstrating or Verifying the Content of the text. 4. In level three, our text is exposed a typical type I and analyzed Inquiry Index 15-25 ( Middle ), but FAST is found type IV, excepting Manipulating Apparatus and Observation and analyzed Inquiry Index over 35 ( Very - High ). Therefore, FAST Program is proved to be the desirable Inquiry Science Curricular Materials. In future, this worker is to arrange the results of the following paper as follows ; 1. The verification of the FAST Program by means of the Integrated Science Curricular Materials. 2. The development of the Inquiring, Integrated Science Curricular Materials through the results of the preceding study.

  • PDF

단층변위를 이용한 단층의 총 이동량 계산법 (A New Method Calculating Total Slip of Fault with Fault Separation)

  • 황재하
    • 자원환경지질
    • /
    • 제31권6호
    • /
    • pp.547-555
    • /
    • 1998
  • A new trigonometrical method for calculating total slip (T) of faulting is presented. The parameters for the calculations are used rake of fault striation, strike and dip of fault and of index planar structure such as bedding plane. The faults are groupped into three types. The direction of plunging of fault striation is out of a range ${\pm}90^{\circ}$ to the bedding dip direction in $360^{\circ}$ system, which is groupped into the type I. Meanwhile, the case of the direction lies in the above range can be separated into two different types, type II and type III, according to relative largeness of the angles rake of fault striation and i (see text). The type II has smaller rake than angle i and the type III has larger rake than angle i. Here I propose a few equations for calculating not only total slip (T) but strike slip (L) or dip slip (S) of the faulting. The equations are adapted selectively to the types of fault mentioned before. The limitation of the method is that the equations do not fit to polyphase faulting.

  • PDF

텍스트마이닝을 활용한 국내외 기록서비스 연구동향 분석 (Analysis of Research Trends on Archival Information Services Using Text Mining)

  • 박서희;이혜은
    • 한국기록관리학회지
    • /
    • 제24권1호
    • /
    • pp.89-109
    • /
    • 2024
  • 본 연구는 국내외 기록정보서비스의 연구 동향을 분석한 것으로 2003년부터 2022년까지 한국학술지인용색인(KCI)에 수록된 학술논문 136편과 LISTA(Library, Information Science & Technology Abstracts)에 수록된 학술논문 74편을 대상으로 연도별, 연구 유형별, 연구자 유형별, 연구 대상별, 연구목적별 현황을 살펴보았다. 또한 텍스트마이닝 기법을 적용하여 빈도분석, 동시출현 빈도분석, 중심성분석, 토픽모델링을 진행하였다. 연구의 결과 국내 논문은 특정 기관이나 기록물에 집중되었고 이용자 중심의 만족도조사 연구, 콘텐츠 중심의 연구 등이 진행되었다. 국외논문은 아키비스트와 이용자 간의 관계를 연구하는 흐름과 함께 평가 중심의 연구, 자료·자원·컬렉션 등의 정보제공 연구가 다수 진행되었음을 확인하였다. 정보자원의 관리는 국내외 논문 공통의 토픽으로 확인되었으나 국내는 정보자원의 품질 유지를, 국외는 정보의 저장과 검색에 집중된 연구 흐름을 파악할 수 있었다.

뉴스와 주가 : 빅데이터 감성분석을 통한 지능형 투자의사결정모형 (Stock-Index Invest Model Using News Big Data Opinion Mining)

  • 김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.143-156
    • /
    • 2012
  • 누구나 뉴스와 주가 사이에는 밀접한 관계를 있을 것이라 생각한다. 그래서 뉴스를 통해 투자기회를 찾고, 투자이익을 얻을 수 있을 것으로 기대한다. 그렇지만 너무나 많은 뉴스들이 실시간으로 생성 전파되며, 정작 어떤 뉴스가 중요한지, 뉴스가 주가에 미치는 영향은 얼마나 되는지를 알아내기는 쉽지 않다. 본 연구는 이러한 뉴스들을 수집 분석하여 주가와 어떠한 관련이 있는지 분석하였다. 뉴스는 그 속성상 특정한 양식을 갖지 않는 비정형 텍스트로 구성되어있다. 이러한 뉴스 컨텐츠를 분석하기 위해 오피니언 마이닝이라는 빅데이터 감성분석 기법을 적용하였고, 이를 통해 주가지수의 등락을 예측하는 지능형 투자의사결정 모형을 제시하였다. 그리고, 모형의 유효성을 검증하기 위하여 마이닝 결과와 주가지수 등락 간의 관계를 통계 분석하였다. 그 결과 뉴스 컨텐츠의 감성분석 결과값과 주가지수 등락과는 유의한 관계를 가지고 있었으며, 좀 더 세부적으로는 주식시장 개장 전 뉴스들과 주가지수의 등락과의 관계 또한 통계적으로 유의하여, 뉴스의 감성분석 결과를 이용해 주가지수의 변동성 예측이 가능할 것으로 판단되었다. 이렇게 도출된 투자의사결정 모형은 여러 유형의 뉴스 중에서 시황 전망 해외 뉴스가 주가지수 변동을 가장 잘 예측하는 것으로 나타났고 로지스틱 회귀분석결과 분류정확도는 주가하락 시 70.0%, 주가상승 시 78.8%이며 전체평균은 74.6%로 나타났다.

안드로이드에서 힌디어 텍스트 처리 방법 (A Text Processing Method for Devanagari Scripts in Andriod)

  • 김재혁;맹승렬
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.560-569
    • /
    • 2011
  • 본 논문에서는 개방형 OS인 안드로이드에서 힌디어 텍스트 처리방법을 제안한다. 텍스트 처리의 핵심은 알파벳을 문자로 조합하는 규칙을 정의하는 오토마타와 폰트 파일에서 문자에 대응하는 이미지를 검색하고 이를 화면에 표시하는 폰트 렌더링이다. 오토마타는 입력 문자의 종류와 개수에 좌우되는데 유니코드를 기반으로 자음 14자와 모음 34자를 알파벳으로 사용하는 오토마타를 제안한다. 조합된 음절은 테이블 매핑 방식을 사용하여 그립 인덱스로 변환하고 해당하는 폰트를 로드하기 위한 핸들로 사용한다. 프리 타입 폰트엔진의 다국어 지원 프레임워크에 따라 제안방법을 별도의 모듈로 추가함으로서 시스템 수준에서 힌디어를 지원할 수 있다. 메시지 어플리케이션을 통해 제안방법의 타당성을 보인다.

Trend Analysis of the Agricultural Industry Based on Text Analytics

  • Choi, Solsaem;Kim, Junhwan;Nam, Seungju
    • Agribusiness and Information Management
    • /
    • 제11권1호
    • /
    • pp.1-9
    • /
    • 2019
  • This research intends to propose the methodology for analyzing the current trends of agriculture, which directly connects to the survival of the nation, and through this methodology, identify the agricultural trend of Korea. Based on the relationship between three types of data - policy reports, academic articles, and news articles - the research deducts the major issues stored by each data through LDA, the representative topic modeling method. By comparing and analyzing the LDA results deducted from each data source, this study intends to identify the implications regarding the current agricultural trends of Korea. This methodology can be utilized in analyzing industrial trends other than agricultural ones. To go on further, it can also be used as a basic resource for contemplation on potential areas in the future through insight on the current situation. database of the profitability of a total of 180 crop types by analyzing Rural Development Administration's survey of agricultural products income of 115 crop types, small land profitability index survey of 53 crop types, and Statistics Korea's survey of production costs of 12 crop types. Furthermore, this research presents the result and developmental process of a web-based crop introduction decision support system that provides overseas cases of new crop introduction support programs, as well as databases of outstanding business success cases of each crop type researched by agricultural institutions.

중국과 미국의 무역클레임 유형과 중요도 비교 연구 : 텍스트 마이닝 기법을 활용하여 (A Comparative Study on the Types and its Importance of Trade Claims between China and the United States: Using Text Mining Techniques)

  • 유천;황윤섭
    • 무역학회지
    • /
    • 제47권3호
    • /
    • pp.177-190
    • /
    • 2022
  • This study is designed to identify the differences in the types and importance of trade claims at the national level. For analysis data, abstracts of arbitration and court judgments published on the website of the United Nations Commission on International Trade Law are collected and used. The target countries are China and the United States, with 102 cases from China and 59 cases from the United States. By applying topic modeling techniques to the collection decisions of China and the United States, trade claims are categorized, and the importance of each type is identified using the network centrality index derived through semantic network analysis. The analysis results are as follows. First, the main types of trade claims were the same for both the United States and China: product nonconformity, delivery issues, and payments. However, in China, the order of product nonconformity > delivery issues > payments was important, and in the United States, payments > product nonconformity > delivery issues were found to be important. This study is significant in that it presents a strategic trade claim management plan using a quantitative methodology.

국학고전자료의 디지털화를 위한 모범적인 방안 연구 (Study on Model Case of Ideal Digitization of Korean Ancient Books)

  • 이희재
    • 정보관리학회지
    • /
    • 제22권1호
    • /
    • pp.105-123
    • /
    • 2005
  • 이 연구는 보존 기록 자료로서의 우리의 고전 장서를 보다 안전하게 보호하고 연구자나 이용자들에게는 시공을 초월한 열람이 가능토록 하기 위한 디지털 도서관으로서의 방법을 모색하는 데 목적이 있다. 즉, 우선 동양 전래의 사부 분류법과 현대적인 주제 분류, 그리고 색인어 등을 통해 다양한 접근점을 제공하고, 둘째, MARC나 XML 등을 활용한 DL시스템을 구축하되, 서지적 기술요소를 최대한 확대시키며. 셋째, 쉬운 해제와 색인어로 이용자의 이해를 극대화하고, 마지막으로 원본의 손상을 막기 위해 원문 DB를 구축하여 열람용으로 사용한다. 이는 향후 국내외 한국 고전 관련기관과 협력, 공유할 수 있는 네트워크 체제를 통해 국제적 서지통정으로 발전될 수 있을 것이다.