• 제목/요약/키워드: Machine knowledge

검색결과 643건 처리시간 0.025초

An Automatic Tagging System and Environments for Construction of Korean Text Database

  • Lee, Woon-Jae;Choi, Key-Sun;Lim, Yun-Ja;Lee, Yong-Ju;Kwon, Oh-Woog;Kim, Hiong-Geun;Park, Young-Chan
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.1082-1087
    • /
    • 1994
  • A set of text database is indispensable to the probabilistic models for speech recognition, linguistic model, and machine translation. We introduce an environment to canstruct text databases : an automatic tagging system and a set of tools for lexical knowledge acquisition, which provides the facilities of automatic part of speech recognition and guessing.

  • PDF

복합제품시스템 추격을 위한 특허 기반 부상기술 탐색: 가스터빈 사례를 중심으로 (Exploration of emerging technologies based on patent analysis in complex product systems for catch-up: the case of gas turbine)

  • 곽기호;박주형
    • 지식경영연구
    • /
    • 제17권2호
    • /
    • pp.27-50
    • /
    • 2016
  • Korean manufacturing industry have recently faced the catch-up of China in the mass commodity product, such as automotive, display, and smart phone in terms of market as well as technology. Accordingly, discussion on the importance of achieving catch-up in complex product systems (CoPS) has been increasing as a new innovation engine for the industry. In order to achieve successful catch-up of CoPS, we explored emerging technologies of CoPS, which are featured by the characteristics of radical novelty, relatively fast growth and self-sustaining, through the study of emerging technologies of gas turbine for power generation. We found that emerging technologies of the gas turbine are technologies for combustion nozzle and composition of electrical machine for increasing power efficiency, washing technology for particulate matter, cast and material processing technology for enhancing durability from fatigue, cooling technologies from extremely high temperature, interconnection operation technology between renewable energy and the gas turbine for flexibility in power generation, and big data technology for remote monitoring and diagnosis of the gas turbine. We also found that those emerging technologies resulted in technological progress of the gas turbine by converging with other conventional technologies in the gas turbine. It indicates that emerging technologies in CoPS can be appeared on various technological knowledge fields and have complementary relationship with conventional technologies for technology progress of CoPS. It also implies that latecomers need to pursue integrated learning that includes emerging technologies as well as conventional technologies rather than independent learning related to emerging technologies for successful catch-up of CoPS. Our findings provide an important initial theoretical ground for investigating the emerging technologies and their characteristics in CoPS as well as recognizing knowledge management strategy for successful catch-up of latecomers. Our findings also contribute to the policy development of the CoPS from the perspective of innovation strategy and knowledge management.

온톨로지 및 사례기반추론을 이용한 맞춤형 통합 정보 생성 프레임워크의 제안 (Framework for Information Integration and Customization Using Ontology and Case-based Reasoning)

  • 이현정;손미애
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.141-158
    • /
    • 2009
  • 다양한 정보자원들로부터 사용자가 요구하는 맞춤화된 정보를 추출해 내는 것은 더욱 어려워지고 있다. RSS를 비롯하여 개선된 다양한 정보 수집 방법들이 개발되었지만, 여전히 정보가공자인 사람의 도움 없이 필요한 정보들을 수집하여 정리 및 가공하는 작업이 쉽지는 않다. 따라서 본 연구에서는 정보사용자들이 사용 목적에 맞게 정보를 가공하는 부담을 줄여주기 위해 사례기반추론과 온톨로지에 기반한 맞춤형 통합정보생성 프레임워크를 제안한다. 본 프레임워크는 세 단계로 구성된다. 첫째, 수집된 웹 정보를 정보가공의 용이성을 위해 사례로 변환한다. 둘째, 동적 유사도 검색을 통해 수집된 사례들로부터 정보 사용자의 동적 요구사항에 적합한 사례를 검색한다. 셋째, 전 단계에서 추출된 사례를 정보사용자의 요구사항에 보다 적합한 지식으로 가공하기 위해 집중 유사도를 적용한다. 본 프레임워크는 여행자들의 정보수집을 위한 여행정보시스템에 적용되어 그 효과를 입증하였다.

  • PDF

A Study on the Prediction Model of the Elderly Depression

  • SEO, Beom-Seok;SUH, Eung-Kyo;KIM, Tae-Hyeong
    • 산경연구논집
    • /
    • 제11권7호
    • /
    • pp.29-40
    • /
    • 2020
  • Purpose: In modern society, many urban problems are occurring, such as aging, hollowing out old city centers and polarization within cities. In this study, we intend to apply big data and machine learning methodologies to predict depression symptoms in the elderly population early on, thus contributing to solving the problem of elderly depression. Research design, data and methodology: Machine learning techniques used random forest and analyzed the correlation between CES-D10 and other variables, which are widely used worldwide, to estimate important variables. Dependent variables were set up as two variables that distinguish normal/depression from moderate/severe depression, and a total of 106 independent variables were included, including subjective health conditions, cognitive abilities, and daily life quality surveys, as well as the objective characteristics of the elderly as well as the subjective health, health, employment, household background, income, consumption, assets, subjective expectations, and quality of life surveys. Results: Studies have shown that satisfaction with residential areas and quality of life and cognitive ability scores have important effects in classifying elderly depression, satisfaction with living quality and economic conditions, and number of outpatient care in living areas and clinics have been important variables. In addition, the results of a random forest performance evaluation, the accuracy of classification model that classify whether elderly depression or not was 86.3%, the sensitivity 79.5%, and the specificity 93.3%. And the accuracy of classification model the degree of elderly depression was 86.1%, sensitivity 93.9% and specificity 74.7%. Conclusions: In this study, the important variables of the estimated predictive model were identified using the random forest technique and the study was conducted with a focus on the predictive performance itself. Although there are limitations in research, such as the lack of clear criteria for the classification of depression levels and the failure to reflect variables other than KLoSA data, it is expected that if additional variables are secured in the future and high-performance predictive models are estimated and utilized through various machine learning techniques, it will be able to consider ways to improve the quality of life of senior citizens through early detection of depression and thus help them make public policy decisions.

위키피디아 기반의 효과적인 개체 링킹을 위한 NIL 개체 인식과 개체 연결 중의성 해소 방법 (A Method to Solve the Entity Linking Ambiguity and NIL Entity Recognition for efficient Entity Linking based on Wikipedia)

  • 이호경;안재현;윤정민;배경만;고영중
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.813-821
    • /
    • 2017
  • 개체 링킹은 입력된 질의에 존재하는 개체를 표현한 개체 표현(entity mention)을 지식베이스에 존재하는 개체와 연결하여 의미를 파악하는 연구이다. 개체 링킹에 관한 연구는 지식 베이스 구축 문제, 다중 표현 문제, 개체 연결 중의성 문제, NIL 개체 인식 문제가 존재한다. 본 연구에서는 지식 베이스 구축 문제와 다중 표현 문제를 해결하기 위해 위키피디아를 기반으로 개체 이름 사전을 구축한다, 또한, 문맥 유사도, 의미적 관련성, 단서 단어 점수, 개체 표현의 개체명 타입 유사도, 개체 이름 매칭 점수, 개체인기도 점수 자질들을 기반으로 SVM(support vector machine)을 학습하여, NIL 개체를 인식하는 문제와 개체 연결 중의성을 해소하는 방법을 제안한다. 구축한 지식 베이스를 기반으로 제안한 두 방법을 순차적으로 적용하였을 때 좋은 개체 링킹 성능을 얻었다. 개체 링킹 시스템의 성능은 NIL 개체 인식 성능이 83.66%, 중의성 해소 성능이 90.81%의 F1 점수를 보였다.

P2P 플랫폼에서의 대출자 신용분석 사례연구: 8퍼센트, 렌딧, 어니스트 펀드 (A Case Study on Credit Analysis System in P2P: 8Percent, Lendit, Honest Fund)

  • 최수만;전동화;오경주
    • 지식경영연구
    • /
    • 제21권3호
    • /
    • pp.229-247
    • /
    • 2020
  • 지식경영 분야의 P2P금융 플랫폼의 성장속에서 빅데이터 및 머신러닝(Machine Learning) 기술을 보유한 회사만이 치열한 경쟁 속에서 생존할 가능성이 높을 것으로 예상된다. 그럼에도 불구하고 관련 서비스를 제공하는 온라인 P2P대출 플랫폼 업체들은 투자자와 대출을 신청하는 중개자로서의 역할을 수행할 뿐이며 투자와 관련된 위험은 모두 투자자에게 귀속시키고 있다. 이러한 이유로, 투자자 입장에서는 투자상품의 안전성을 확인할 수 있는 유일한 방법이 신문이나 온라인 웹사이트를 통한 P2P대출 플랫폼 업체의 평판에만 의존할 수 밖에 없는 실정이다. 또한, 한국의 P2P대출 플랫폼 업체들이 대출자의 개별 신용분석을 체계적으로 실시하여 연체율 등의 시계열 정보를 정확히 파악하기에는 시간적, 경제적 여건이 매우 열악한 상황이다. 그러나, 최근 몇몇 P2P대출 플랫폼 업체들이 업체별 대출자 신용분석에 대한 역량을 가장 중요한 영업자산으로 인식함으로써 빅데이터 및 머신러닝 기술을 바탕으로 인공지능(AI)에 기반한 새로운 신용평가 시스템을 구축하고 시행에 들어가고 있음은 매우 긍정적으로 평가된다. 따라서, 본 연구에서는 신용대출 시장에 주력하고 있으며 인공지능 활용으로 잘 알려진 상위 3개 업체를 대상으로 사례분석 방식을 통해 인공지능을 활용한 대출자 신용분석 절차 및 사용하는 정보 데이터의 종류 등을 분석하고자 한다. 이를 통하여 현 상황에서 P2P 플랫폼 업체들의 인공지능을 통한 신용분석 기법을 이해하고 현 시점에서 국내 인공지능을 활용한 신용분석 방식의 한계점과 개선방안 등을 함께 고찰하고자 한다.

대형 언어 모델을 활용한 기업데이터 분석: ChatGPT를 활용한 직원 이직 예측 (Leveraging LLMs for Corporate Data Analysis: Employee Turnover Prediction with ChatGPT)

  • 김성민;정지용
    • 지식경영연구
    • /
    • 제25권2호
    • /
    • pp.19-47
    • /
    • 2024
  • 기업의 데이터 분석 및 활용 역량은 전사 차원의 지식경영과 의사결정에 중요한 역할을 한다. 이 연구는 대형 언어 모델이 기업데이터 분석에서 어떻게 활용될 수 있는지 알아보고자 수행되었다. 구체적으로 인적자원 분야에 초점을 맞추어, 대형 언어 모델의 데이터 분석 역량을 검증해 보았다. 이를 위해 인사분야에서 많은 연구가 이루어져온 공개데이터셋 IBM HR 데이터를 소재로, 선행연구들에서 이루어진 머신러닝 기반 이직자 예측 분석을 ChatGPT를 통해 재현하고 그 예측성능을 비교해보았다. 고급 프로그래밍 역량이 필요했던 과거 연구방식과 달리, 분석가의 자연어 요청으로 진행한 ChatGPT 기반 머신러닝 데이터 분석은 훨씬 쉽고 빠르다는 장점이 있었고, 예측 정확도 역시 선행연구와 비교해 경쟁력 있는 수준을 기록했다. 이는 그동안 고급 프로그래밍 역량이 요구되던 기업데이터 분석 분야에서, ChatGPT를 비롯한 대형 언어 모델들이 효과적이고 실질적인 대안이 될 수 있다는 가능성을 시사한다. 또한 이를 통해 데이터 분석의 대중화 나아가 데이터 기반 의사결정(DDDM: Data-Driven Decision Making)의 확산에도 기여할 수 있을 것으로 기대된다. 데이터분석 과정에서 사용한 프롬프트와 ChatGPT가 생성한 프로그래밍 코드도 부록에 수록하여 검증 가능하게 함으로써, 향후 대형 언어 모델을 활용한 데이터분석 연구의 초석을 제공하고자 한다.

학교보건사업을 통한 건강증진 사업에 대한 연구 (A Study on School Health Promotion Services)

  • 남철현
    • 한국학교보건학회지
    • /
    • 제10권2호
    • /
    • pp.193-211
    • /
    • 1997
  • The study was designed to gain necessary basic data in order to grasp the health knowledge, attitude, and practice level of students and teachers of elementary, middle and high schools. This study was conducted through interviews of 3,400 students and 1,022 teachers attending 14 different schools large, middle and small cities and rural towns during a period of nine months (from Oct. 2 1995 to Jun. 30 1996). By the results of this study, the recommendations can be summarized as follows: 1. A school health development committee should be established of 10 members: school health related teachers (physical trainers, nurses, and teachers in charge of health), parents, persons related to health administration, local medical doctors, and student reprensentatives in order to support and immplement school health development plans. 2. Like advanced countries, a health class of 2~4 hours should beplaced in middle and high schools. A nurse majoring in health from a university should be the teacher. 3. A curriculum of health should contain the following: education on health, sex, alcohol, tabacco, the misuse of the drugs, the structure and function of human body, the growth of the body, mental health, safety and emergency care, the prevention of disease, proper eating habits and nutrition, daily health life, family health education, society health, community health, environmental pollution and individual responsibility. 4. Create a school health promotion center, with a nurse's office, and a sports center which has health machines (bars, aerobics, training, twist machine, belt massage, running machine, bench press, chest waist, hack hip extension machine) as well as a physical strength measuring machine (muscular strength, alertness, flexibility, endurance, lung functions and so on), so that the teaching staff and students can use them and train their bodies. 5. Through a refresher education program, urge teachers to understand school health promotion services. 6. Regulate a standard and establish a system of monitoring the physical enviroment of the school (the height of desks and chairs, illumination facilities, ventilation facilities, safe drinking water). 7. Create a check list of health to evaluate improvement.

  • PDF

기계학습 클러스터링을 이용한 승하차 패턴에 따른 서울시 지하철역 분류 (Classification of Seoul Metro Stations Based on Boarding/ Alighting Patterns Using Machine Learning Clustering)

  • 민미경
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.13-18
    • /
    • 2018
  • 본 연구에서는 기계학습을 이용하여 서울시 지하철역의 승하차 패턴에 따라 지하철역을 분류한다. 대상 데이터는 공공데이터 포탈에서 제공하는 2008년부터 2017년까지 서울 지하철 233개 역에서의 매일 매시간별 승차객 숫자와 하차객 숫자이다. 기계학습 기법으로는 가우시안 혼합 모델(GMM)과 K-평균 클러스터링을 사용한다. 이용객의 승차시간과 하차시간의 분포는 가우시안 혼합 모델로 모델링할 수 있으며, 이를 K-평균 클러스터링을 이용하여 비지도 학습시킨다. 학습결과 서울시 지하철역은 승하차 패턴에 따라 4개의 그룹으로 분류되었다. 본 연구의 결과는 서울시 지하철역의 특성을 파악하여 경제, 사회, 문화적으로 분석하기 위한 주요 기반 지식으로 활용될 수 있다. 본 연구의 방법은 클러스터링이 필요한 모든 공공데이터나 빅데이터에 적용할 수 있다.

공문서의 기계가독형(Machine Readable) 전환 방법 제언 (Suggestions on how to convert official documents to Machine Readable)

  • 임진희
    • 기록학연구
    • /
    • 제67호
    • /
    • pp.99-138
    • /
    • 2021
  • 빅데이터 시대에 정형데이터 뿐만 아니라 비정형데이터를 분석하는 것이 중요한 과제로 대두되고 있다. 정부기관이 생산하는 공문서도 텍스트 기반의 대형 비정형데이터로 빅데이터 분석의 대상이 된다. 기관 내부의 업무효율, 지식관리, 기록관리 등의 관점에서 공문서 빅데이터를 분석하여 유용한 시사점을 도출해 나가야 할 것이다. 그러나, 현재 공공기관이 보유 중인 공문서의 상당수가 개방포맷이 아니어서 빅데이터 분석을 하려면 비트스트림에서 텍스트를 추출하는 전처리 과정이 요구된다. 또한, 문서파일 내에 맥락 메타데이터가 충분히 저장되어 있지 못하여 품질 높은 분석을 하려면 별도의 메타데이터 확보 노력이 필요하다. 결론적으로 현재의 공문서는 기계가독(machine readable) 수준이 낮아 빅데이터 분석에 비용이 많이 들게 된다. 이 연구에서는 향후 공문서가 기계가독 수준을 높이기 위해서는 공문서의 개방포맷화, 기안문 서식의 표준태그화, 자기 기술(self-descriptive) 메타데이터 확보, 문서 텍스트 태깅 등이 선행될 필요가 있다는 점을 제안한다. 첫째, 문서가 스스로를 설명하기 위해 추가되어야 하는 메타데이터 항목들을 제시하고 이 메타데이터들이 기계가독형이 되도록 문서파일에 저장하는 방법을 제안한다. 둘째, 문서 내용 분석 시 자연어 처리에만 의존하지 않고 행정 맥락에 따라 중요한 키워드를 미리 국제표준 태그로 마킹하여 기계가독형이 되도록 하는 방안을 제안한다.