• 제목/요약/키워드: 핵심단어 분석

검색결과 158건 처리시간 0.034초

말뭉치에 근거한 한국어 사전 표제어 구성

  • Park, Yeong-Hwan;Yun, Jun-Tae;Song, Man-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.58-65
    • /
    • 1991
  • 사전은 자연어를 처리하는 핵심 부분을 이루고 있다. 그러나 기존의 한국어 사전은 기계적인 처리에 직접 이용하기에는 크게 미흡하다. 특히, 사전의 기본을 이루는 표제어 수록에 관한 연구는 더욱 취약한 형편이다. 본 연구는 새로운 한국어 사전의 표제어률 구성하기 위하여 대형 말뭉치를 수집하였다. 이 말뭉치를 이용하여 기존 사전에서 빠져있는 미등록어들을 찾아내어 수록하고, 말뭉치에 나타난 각 단어의 출현 빈도를 조사하였다. 이 연구를 수행하기 위하여 형태소 분석기, 용례 분석기 등의 필수적인 텍스트 처리 도구들을 개발하였다. 또한, 말뭉치에 나타난 어절 단위의 오류 분포를 조사하여 밝히었다.

  • PDF

An Exploratory Study on Desirable Changes for Corporate Names -The Case of Korean Companies (바람직한 상호변경에 관한 탐색적 연구 - 한국 기업의 경우)

  • 장대련;정강옥;장동련
    • Asia Marketing Journal
    • /
    • 제4권1호
    • /
    • pp.55-76
    • /
    • 2002
  • 상호는 기업의 핵심 자산이며 브랜드의 가장 중요한 구성 요소이다. 그러므로 상호변경은 기업 가치와 기업 이해관계자의 반응에 영향을 미칠 수 있다. 본 연구는 마케팅 측면에서 우리나라 기업들의 상호변경에 대하여 다루었다. 연구 방법으로 사례 및 이의 내용 분석을 실시하였다. 연구 결과, 변경된 상호는 짧아진 경우가 많았으며, 상호의 제품 묘사 정도는 감소한 것으로 나타났다. 상호의 지역 표현은 제거되거나 감소되었으며, 절대적으로 필요하지 않는 단어는 상호에서 제거되는 것으로 나타났다. 약자 상호와 신조어 상호의 사용은 증가한 것으로 밝혀졌다. 우리나라 기업의 상호변경 특성으로 모기업 상호로 상호변경이 이루어진 경우가 많았으며 한자어와 영어로 된 상호가 다수를 차지하고 있었다. 그리고 이러한 현상의 대부분은 서비스업보다 제조업의 상호변경에서 더 높게 나타났다. 후반부에 바람직한 상호의 특성과 역할을 브랜드 관련 문헌들을 토대로 하여 제시하고 이를 우리나라 기업의 상호변경 사례 분석에 대비하여 논하였다. 마지막으로 본 연구의 마케팅 및 브랜드에서의 시사점과 향후 연구 방향을 제시하였다.

  • PDF

Opinion Mining of Product Reviews using Sentiment Phrase Patterns considered the Endings of Declinable Words (어미변화를 고려한 감성 구문 패턴을 이용한 상품평 의견 분류)

  • Kim, Jung-Ho;Cha, Myung-Hoon;Kim, Myung-Kyu;Chae, Soo-Hoan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.285-290
    • /
    • 2010
  • 인터넷이 대중화됨에 따라 누구나 쉽게 자신의 의견을 온라인상에 표현할 수 있게 되었다. 그 결과 생각이나 느낌을 나타내는 의견 데이터들의 양이 급속도로 방대해졌으며, 이러한 데이터들을 이용한 여러 응용 사례들의 등장으로, 효율적인 검색 및 자동 분류 기술이 요구되고 있다. 이런 기술적 흐름에 맞추어 의견 데이터 분류에 관한 여러 연구들이 이루어져 왔다. 이러한 의견 분류에 대한 연구들을 살펴보면, 분류를 위해 자질(Feature)로서 사용한 단일어(Single word)가 아닌 2개 이상의 N-gram 단어, 어휘 구문 패턴 및 통사 구문 패턴 등을 사용한다. 특히, 패턴은 단일어나 N-gram 단어에 비해 유연하고, 언어학적으로 풍부한 정보를 표현할 수 있기 때문에 이를 주요 연구 주제로 사용되었다. 그럼에도 불구하고, 이러한 연구들은 주로 영어에 대한 연구들이었으며, 한국어에 패턴을 적용하여 주관성을 갖는 문장을 분류하거나, 극성을 분류하는 연구들은 아직 미비하다. 한국어의 특색으로 한국어는 용언의 활용이 발달되어 있어, 어미의 변화가 다양하며, 그 변화에 따라 의미가 미묘하게 변화한다. 그러나 기존 한국어에 대한 의견 분류 연구들은 단어의 핵심 의미만을 파악하기 위해 어미 부분을 제거하고 어간만을 취해서 처리하여 어미에 대한 의미변화를 고려하지 못하므로 분류 정확도가 영어권에 연구 결과에 비해 떨어진다. 그래서 본 연구는 영어에 적용된 패턴을 이용한 기존 방법들을 정리하고, 그 방법들 중에서 극성을 지닌 문장성분 패턴을 한국어에 적용하였다. 그리고 어미의 변화에 대한 패턴을 추출하여 이 변화가 의견 분류의 성능에 미치는 영향을 분석하였다.

  • PDF

A Study on the Intellectual Structure of Metadata Research by Using Co-word Analysis (동시출현단어 분석에 기반한 메타데이터 분야의 지적구조에 관한 연구)

  • Choi, Ye-Jin;Chung, Yeon-Kyoung
    • Journal of the Korean Society for information Management
    • /
    • 제33권3호
    • /
    • pp.63-83
    • /
    • 2016
  • As the usage of information resources produced in various media and forms has been increased, the importance of metadata as a tool of information organization to describe the information resources becomes increasingly crucial. The purposes of this study are to analyze and to demonstrate the intellectual structure in the field of metadata through co-word analysis. The data set was collected from the journals which were registered in the Core collection of Web of Science citation database during the period from January 1, 1998 to July 8, 2016. Among them, the bibliographic data from 727 journals was collected using Topic category search with the query word 'metadata'. From 727 journal articles, 410 journals with author keywords were selected and after data preprocessing, 1,137 author keywords were extracted. Finally, a total of 37 final keywords which had more than 6 frequency were selected for analysis. In order to demonstrate the intellectual structure of metadata field, network analysis was conducted. As a result, 2 domains and 9 clusters were derived, and intellectual relations among keywords from metadata field were visualized, and proposed keywords with high global centrality and local centrality. Six clusters from cluster analysis were shown in the map of multidimensional scaling, and the knowledge structure was proposed based on the correlations among each keywords. The results of this study are expected to help to understand the intellectual structure of metadata field through visualization and to guide directions in new approaches of metadata related studies.

Syllables-based Named Entity Extraction and Automatic Corpus Construction using Bidirectional Dynamic LST (Bidirectional Dynamic LSTM 을 이용한 음절 단위 개체명 추출 및 자동화된 말뭉치 구축)

  • Oh, Sungsik;Lim, Changdae;Ahn, Keeho;Park, Weijin
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.317-320
    • /
    • 2017
  • 개체명 인식은 자연어 문장에서 장소, 제작물, 사람 등 분류를 통한 의미 부여가 가능한 단어를 파악하는 기술로서 의미 분석을 위한 핵심 기술이다. 현재 많은 개체명 분석 관련 연구들은 형태소 분석 결과에 의존적인 형태를 갖고 있어서, 형태소 분석 결과의 정확성이 개체명 분석 결과의 성능에 영향을 미치고 있다. 본 연구에서는 형태소 분석 과정을 거치지 않는 음절 기반의 개체명 분석 기술을 제안하여 형태소 분석의 정확도가 낮은 통신어, 신조어 분석 성능을 향상하였다. 또한, 자동화된 방법으로 음절 단위 개체명 말뭉치 및 개체명 사전을 구축하는 프로세스를 정의하여 개체명 분석의 정확도 향상 및 인지 범주의 확대를 도모하였다. 본 연구에서 제안한 개체명 인식 기술은 한국어 개체명 표준에 기반한 129가지의 개체명 분류가 가능하며, 이는 자연어 처리 기술이 필요한 산업계에서 상용화하는데 큰 기여를 할 것으로 판단된다.

  • PDF

Comparative Analysis of Consumer Needs for Products, Service, and Integrated Product Service : Focusing on Amazon Online Reviews (제품, 서비스, 융합제품서비스의 소비자 니즈 비교 분석 :아마존 온라인 리뷰를 중심으로)

  • Kim, Sungbum
    • The Journal of the Korea Contents Association
    • /
    • 제20권7호
    • /
    • pp.316-330
    • /
    • 2020
  • The study analyzes reviews of hardware products, customer service products, and products that take the form of a convergence of hardware and cloud services in ICT using text mining. We derive keywords of each review and find the differentiation of words that are used to derive topics. A cluster analysis is performed to categorize reviews into their respective clusters. Through this study, we observed which keywords are most often used for each product type and found topics that express the characteristics of products and services using topic modeling. We derived keywords such as "professional" and "technician" which are topics that suggest the excellence of the service provider in the review of service products. Further, we identified adjectives with positive connotations such as "favorite", "fine", "fun", "nice", "smart", "unlimited", and "useful" from Amazon Eco review, an integrated product and service. Using the cluster analysis, the entire review was clustered into three groups, and three product type reviews exclusively resulted in belonging to each different cluster. The study analyzed the differences whereby consumer needs are expressed differently in reviews depending on the type of product and suggested that it is necessary to differentiate product planning and marketing promotion according to the product type in practice.

A Systematic Literature Review on Smart Factory Research: Identifying Research Trends in Korean Academia (스마트공장에 관한 체계적 문헌 분석: 국내 학술 경향 연구)

  • Kim, Gibum;Lee, Jungwoo
    • Journal of Digital Convergence
    • /
    • 제18권11호
    • /
    • pp.59-71
    • /
    • 2020
  • The paper reports on a systematic literature review results concerning the smart factory research in Korea. 144 papers were identified from the articles published in Korean journals listed in the Korean citation index by keyword search related to smart factory. Bibliometric analyses were conducted by way of co-occurrence and network analysis using the VOSViewer. Automation, intelligence, and bigdata were identifed as three critical clusters of research while, operating systems, international policy and cases, concept analysis as other three clusters of research. Internet of Things turned out to be a key technology of smart factory linking all of these areas. Servitization studies were small in numbers but seemed to have a lot of potential. Security researches seemed to be lacking connections with other areas of studies. Results of this study can be used as a milestone for identifying future research issues in smart factories.

Analysis on Topics of Digital Preservation Researches and Courses (디지털 보존 관련 학술연구 및 교과 주제분석)

  • Jeong, Uiyeon;Choi, Sanghee
    • Journal of the Korean Society for Library and Information Science
    • /
    • 제53권3호
    • /
    • pp.25-43
    • /
    • 2019
  • Recently there has been a growing interest in digital preservation and digital curation with rapid increase of digital resource. This study aims to investigate the research topics and the course topics related digital preservation and digital curation. The course information is collected from the curricular of library and information science departments and archival science departments in leading countries such as US, England, Ireland, Canada and New Zealand. Title keyword profiling and network analysis were adapted to discover core research and education areas. The key topics in the abstracts of research papers and the contents of the course were also illustrated by these methods. In the research analysis, archival system is the biggest area of researches related digital preservation and digital curation. Courser analysis shows digital curation education and process is the important area of education. As a result of content analysis, plan and strategy is a notable topic of research and record management process is a major topic of courses for digital preservation and digital curation. In addition, format of digital resource is an important topic for research and courses.

Text Mining of Successful Casebook of Agricultural Settlement in Graduates of Korea National College of Agriculture and Fisheries - Frequency Analysis and Word Cloud of Key Words - (한국농수산대학 졸업생 영농정착 성공 사례집의 Text Mining - 주요단어의 빈도 분석 및 word cloud -)

  • Joo, J.S.;Kim, J.S.;Park, S.Y.;Song, C.Y.
    • Journal of Practical Agriculture & Fisheries Research
    • /
    • 제20권2호
    • /
    • pp.57-72
    • /
    • 2018
  • In order to extract meaningful information from the excellent farming settlement cases of young farmers published by KNCAF, we studied the key words with text mining and created a word cloud for visualization. First, in the text mining results for the entire sample, the words 'CEO', 'corporate executive', 'think', 'self', 'start', 'mind', and 'effort' are the words with high frequency among the top 50 core words. Their ability to think, judge and push ahead with themselves is a result of showing that they have ability of to be managers or managers. And it is a expression of how they manages to achieve their dream without giving up their dream. The high frequency of words such as "father" and "parent" is due to the high ratio of parents' cooperation and succession. Also 'KNCAF', 'university', 'graduation' and 'study' are the results of their high educational awareness, and 'organic farming' and 'eco-friendly' are the result of the interest in eco-friendly agriculture. In addition, words related to the 6th industry such as 'sales' and 'experience' represent their efforts to revitalize farming and fishing villages. Meanwhile, 'internet', 'blog', 'online', 'SNS', 'ICT', 'composite' and 'smart' were not included in the top 50. However, the fact that these words were extracted without omission shows that young farmers are increasingly interested in the scientificization and high-tech of agriculture and fisheries Next, as a result of grouping the top 50 key words by crop, the words 'facilities' in livestock, vegetables and aquatic crops, the words 'equipment' and 'machine' in food crops were extracted as main words. 'Eco-friendly' and 'organic' appeared in vegetable crops and food crops, and 'organic' appeared in fruit crops. The 'worm' of eco-friendly farming method appeared in the food crops, and the 'certification', which means excellent agricultural and marine products, appeared only in the fishery crops. 'Production', which is related to '6th industry', appeared in all crops, 'processing' and 'distribution' appeared in the fruit crops, and 'experience' appeared in the vegetable crops, food crops and fruit crops. To visualize the extracted words by text mining, we created a word cloud with the entire samples and each crop sample. As a result, we were able to judge the meaning of excellent practices, which are unstructured text, by character size.

A Study on the Structures and Characteristics of National Policy Knowledge (국가 정책지식의 구조와 특성에 관한 연구)

  • Lee, Ji-Sue;Chung, Young-Mee
    • Journal of Information Management
    • /
    • 제41권2호
    • /
    • pp.1-30
    • /
    • 2010
  • This study analyzed research output in dominant research areas of 19 national research institutions. Policy knowledge produced by the institutions during the past 5 years mainly concerned 10 policies dealing with economy and society issues. Similarities between the research subjects of the institutions were displayed by MDS mapping. The study also identified issue attention cycles of the 5 chosen policies and examined the correlation between the issue attention cycles and the yields of policy knowledge. The knowledge structure of each policy was mapped using co-word analysis and Ward's clustering. It was also found that the institutions performing research on similar subjects demonstrated citation preferences for each other.