• Title/Summary/Keyword: 자동 코드 분류

Search Result 79, Processing Time 0.031 seconds

A study on the use of DDC scheme in directory search engine for research information resources on internet (인터넷 학술정보자원의 디렉토리 서비스 설계에 있어서 DDC 분류체계의 활용에 관한 연구)

  • 최재황
    • Journal of the Korean Society for information Management
    • /
    • v.15 no.2
    • /
    • pp.47-68
    • /
    • 1998
  • Although the research information resources on Internet are spread out on thousands of computers, it is not always easy to get them on the right time by the right manner. The purpose of this study is to use DDC(Dewey Decimal Classification) scheme in subject-based directory search engine for research information resourcees to aid retrieval on the Internet. For the design of classification code, this study followed 'systematic order' of DDC to arrange subjects from the general o the specific in a logical order, and for the design of classification dictionary, 'Relative Index' of DDC was used to bring together the various aspects of subjects.

  • PDF

Fingerprint Classification using Multiple Decision Templates with SVM (SVM의 다중결정템플릿을 이용한 지문분류)

  • Min Jun-Ki;Hong Jin-Hyuk;Cho Sung-Bae
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.11
    • /
    • pp.1136-1146
    • /
    • 2005
  • Fingerprint classification is useful in an automated fingerprint identification system (AFIS) to reduce the matching time by categorizing fingerprints. Based on Henry system that classifies fingerprints into S classes, various techniques such as neural networks and support vector machines (SVMs) have been widely used to classify fingerprints. Especially, SVMs of high classification performance have been actively investigated. Since the SVM is binary classifier, we propose a novel classifier-combination model, multiple decision templates (MuDTs), to classily fingerprints. The method extracts several clusters of different characteristics from samples of a class and constructs a suitable combination model to overcome the restriction of the single model, which may be subject to the ambiguous images. With the experimental results of the proposed on the FingerCodes extracted from NIST Database4 for the five-class and four-class problems, we have achieved a classification accuracy of $90.4\%\;and\;94.9\%\;with\;1.8\%$ rejection, respectively.

Recognition of Passport Image Using Removing Noise Branches and Enhanced Fuzzy ART (잡영 가지 제거 알고리즘과 개선된 퍼지 ART를 이용한 여권 코드 인식)

  • Lee, Sang-Soo;Jang, Do-Won;Kim, Kwang-Baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.2
    • /
    • pp.377-382
    • /
    • 2005
  • 본 논문에서는 출입국자 관리의 효율성과 체계적인 출입국 관리를 위하여 여권 코드를 자동으로 인식하는 방법을 제안한다. 여권 이미지는 기울어진 상태로 스캔 되어 획득되어질 수도 있으므로 기울기 보정은 문자 분할 및 인식에 있어 매우 중요하다. 따라서 본 논문에서는 여권 영상을 스미어링한 후, 추출된 문자열 중에서 가장 긴 문자열을 선택하고 이 문자열의 좌측과 우측 부분의 두께 중심을 연결하는 직선과 수평선과의 기울기를 이용하여 여권 영상에 대한 각도 보정을 수행한다. 여권 코드 추출은 소벨 연산자와 수평 스미어링, 8방향 윤관선 추적 알고리즘을 적용하여 여권 코드의 문자열 영역을 추출하고, 추출된 여권 코드 문자열 영역에 대해 반복 이진화 방법을 적용하여 코드의 문자열 영역을 이진화 한다, 이진화된 문자열 영역에 대해 여권 코드의 인식율을 높이기 위하여 잡영 가지 제거 알고리즘을 적용하여 개별 문자의 잡영을 제거한 후에 개별 코드를 추출하며, CDM 마스크를 적용하여 추출된 개별코드를 복원한다. 추출된 개별코드는 개선된 퍼지 ART 알고리즘을 제안하여 인식에 적용한다. 실제 여권 영상을 대상으로 실험한 결과, CDM 마스크를 이용하여 추출된 개별 코드를 개선된 퍼지 ART 알고리즘을 적용하여 인식한 방법보다 잡영 제거 알고리즘과 CDM 마스크를 적용하여 개선된 퍼지 ART 알고리즘으로 개별 코드를 인식하는 것이 효율적인 것을 확인하였다. 그리고 기존의 퍼지 ART 알고리즘을 이용하여 개별 코드를 인식하는 경우보다 본 논문에서 제안한 개선된 퍼지 ART 알고리즘을 이용하여 개별 코드를 인식하는 경우가 서로 다른 패턴들이 같은 클러스터로 분류되지 않아 인식 성능이 개선되었다.생산하고 있다. 또한 이러한 자료를 바탕으로 지역통계 수요에 즉각 대처할 수 있다. 더 나아가 이와 같은 통계는 전 국민에 대한 패널자료이기 때문에 통계적 활용의 범위가 방대하다. 특히 개인, 가구, 사업체 등 사회 활동의 주체들이 어떻게 변화하는지를 추적할 수 있는 자료를 생산함으로써 다양한 인과적 통계분석을 할 수 있다. 행정자료를 활용한 인구센서스의 이러한 특징은 국가의 교육정책, 노동정책, 복지정책 등 다양한 정책을 정확한 자료를 근거로 수립할 수 있는 기반을 제공한다(Gaasemyr, 1999). 이와 더불어 행정자료 기반의 인구센서스는 비용이 적게 드는 장점이 있다. 예를 들어 덴마크나 핀란드에서는 조사로 자료를 생산하던 때의 1/20 정도 비용으로 행정자료로 인구센서스의 모든 자료를 생산하고 있다. 특히, 최근 모든 행정자료들이 정보통신기술에 의해 데이터베이스 형태로 바뀌고, 인터넷을 근간으로 한 컴퓨터네트워크가 발달함에 따라 각 부처별로 행정을 위해 축적한 자료를 정보통신기술로 연계${cdot}$통합하면 막대한 조사비용을 들이지 않더라도 인구센서스자료를 적은 비용으로 생산할 수 있는 근간이 마련되었다. 이렇듯 행정자료 기반의 인구센서스가 많은 장점을 가졌지만, 그렇다고 모든 국가가 당장 행정자료로 인구센서스를 대체할 수 있는 것은 아니다. 행정자료로 인구센서스통계를 생산하기 위해서는 각 행정부서별로 사용하는 행정자료들을 연계${cdot}$통합할 수 있도록 국가사회전반에 걸쳐 행정 체제가 갖추어져야 하기 때문이다. 특히 모든 국민 개개인에 관한 기본정보, 개인들이 거주하며 생활하는 단위인 개별 주거단위에 관한 정보가 행정부에 등록되어

  • PDF

Improving the Classification of Population and Housing Census with AI: An Industry and Job Code Study

  • Byung-Il Yun;Dahye Kim;Young-Jin Kim;Medard Edmund Mswahili;Young-Seob Jeong
    • Journal of the Korea Society of Computer and Information
    • /
    • v.28 no.4
    • /
    • pp.21-29
    • /
    • 2023
  • In this paper, we propose an AI-based system for automatically classifying industry and occupation codes in the population census. The accurate classification of industry and occupation codes is crucial for informing policy decisions, allocating resources, and conducting research. However, this task has traditionally been performed by human coders, which is time-consuming, resource-intensive, and prone to errors. Our system represents a significant improvement over the existing rule-based system used by the statistics agency, which relies on user-entered data for code classification. In this paper, we trained and evaluated several models, and developed an ensemble model that achieved an 86.76% match accuracy in industry and 81.84% in occupation, outperforming the best individual model. Additionally, we propose process improvement work based on the classification probability results of the model. Our proposed method utilizes an ensemble model that combines transfer learning techniques with pre-trained models. In this paper, we demonstrate the potential for AI-based systems to improve the accuracy and efficiency of population census data classification. By automating this process with AI, we can achieve more accurate and consistent results while reducing the workload on agency staff.

Classifying Windows Executables using API-based Information and Machine Learning (API 정보와 기계학습을 통한 윈도우 실행파일 분류)

  • Cho, DaeHee;Lim, Kyeonghwan;Cho, Seong-je;Han, Sangchul;Hwang, Young-sup
    • Journal of KIISE
    • /
    • v.43 no.12
    • /
    • pp.1325-1333
    • /
    • 2016
  • Software classification has several applications such as copyright infringement detection, malware classification, and software automatic categorization in software repositories. It can be also employed by software filtering systems to prevent the transmission of illegal software. If illegal software is identified by measuring software similarity in software filtering systems, the average number of comparisons can be reduced by shrinking the search space. In this study, we focused on the classification of Windows executables using API call information and machine learning. We evaluated the classification performance of machine learning-based classifier according to the refinement method for API information and machine learning algorithm. The results showed that the classification success rate of SVM (Support Vector Machine) with PolyKernel was higher than other algorithms. Since the API call information can be extracted from binary executables and machine learning-based classifier can identify tampered executables, API call information and machine learning-based software classifiers are suitable for software filtering systems.

Nesting Algorithm for Optimal Layout of Cutting parts in Laser Cutting Process (레이저 절단공정에서 절단부재의 최적배치를 위한 네스팅 알고리즘)

  • 한국찬;나석주
    • Journal of Welding and Joining
    • /
    • v.12 no.2
    • /
    • pp.11-19
    • /
    • 1994
  • 레이저 가공기술은 재료가공 분야에서 넓은 응용분야를 가지고 있으며, 특히 절단, 용접, 열처리 등의 가공분야에서 고정밀도와 자동화의 용이성으로 인해 생산성이 높은, 고부가가치의 첨단응용 기술로 부각되고 있다. 특히 레이저절단은 타 절단법에 비교되는 절단정도, 열영향, 생산성, 작업 환경등의 각종 우위성으로 박판 및 후판절단분야에서 급속한 보급을 보이기 시작하였다. 현재 대 부분의 레이저 가공기는 CNC화 되어가고 있는 추세이며, 레이저 절단의 경우 생산성증대 및 고 정밀화를 위하여 CAD/CAM인터페이스에 의한 자동화가 필연적인 상황이다. 뿐만아니라 고출력 레이저 발전기를 가공 기본체에 탑재한 탑재형 레이저가공기의 출현으로 대형부재의 절단이 가능 하게 되었으며, 더불어 절단공정의 무인화를 지향하는 각종 시스템이 개발되고 있다. 이와 같은 무인화, 생산성증대, 작업시간단축과 러닝 코스트 및 재료의 절감을 위한 노력의 일환으로 컴 퓨터에 의한 자동 및 반자동 네스팅 시스템의 개발을 들 수 있다. 레이저에 의한 2차원 절단응 용분야에서의 네스팅작업은 설계가 끝난 각 부품의 절단작업의 전단계로서 수행되며, 일반적으로 네스팅공정이 완료되면 절단경로를 결정하고 가공조건과 함께 수치제어공작기계의 제어에 필요한 NC코드를 생성하게 된다. 최근에는 이와 같은 네스팅 시스템이 일부 생산현장에 적용되고 있 으나 이러한 시스템들의 대부분이 외국에서 개발된 것을 수입하여 사용하는 실정이다. 2차원 패턴의 최적자동배치문제는 비단 레이저 절단과 같은 열가공 분야에서 뿐만 아니라 블랭킹 금형, 의류, 유리, 목재등 여러분야에서 응용이 가능하며 패키지의 국산화가 시급한 실정이다. 네스 팅작업은 적용되는 분야에 따라 요구사항과 구속조건이 달라지며 이로 인해 알고리즘과 자료구 조도 달라지게 되나 공통적인 목표는 주어진 영역안에서 겹침없이 배치하면서 버림율을 최소화 하는 것이다. 지난 10여년간 여러 산업의 응용분야에서는 네스팅시스템의 도입이 활발하게 이 루어지고 있는데 수동에 반자동 및 자동에 이르기까지 다양하나 자동네스팅시스템의 경우 배치 효율의 신뢰성이 비교적 부족하기 때문에 아직까지는 생산현장에서 기피하는 실정이다. 배치알 고리즘의 관점에서 볼 때 이러한 문제들은 NP-complete문제로 분류하며 제한된 시간안에 최적의 해를 구하기가 가능한 조합 최적화 문제로 알려져 있다. 따라서 이 글에서는 레이저 절단분야 에서의 네스팅시스템에 관한 개요와 최근의 연구동향 그리고 몇 가지 전형적인 네스팅 알고리 즘들을 소개하고 비교분석을 통해 개선점을 간략하게 논의하고자 한다.

  • PDF

IPC Multi-label Classification based on Functional Characteristics of Fields in Patent Documents (특허문서 필드의 기능적 특성을 활용한 IPC 다중 레이블 분류)

  • Lim, Sora;Kwon, YongJin
    • Journal of Internet Computing and Services
    • /
    • v.18 no.1
    • /
    • pp.77-88
    • /
    • 2017
  • Recently, with the advent of knowledge based society where information and knowledge make values, patents which are the representative form of intellectual property have become important, and the number of the patents follows growing trends. Thus, it needs to classify the patents depending on the technological topic of the invention appropriately in order to use a vast amount of the patent information effectively. IPC (International Patent Classification) is widely used for this situation. Researches about IPC automatic classification have been studied using data mining and machine learning algorithms to improve current IPC classification task which categorizes patent documents by hand. However, most of the previous researches have focused on applying various existing machine learning methods to the patent documents rather than considering on the characteristics of the data or the structure of patent documents. In this paper, therefore, we propose to use two structural fields, technical field and background, considered as having impacts on the patent classification, where the two field are selected by applying of the characteristics of patent documents and the role of the structural fields. We also construct multi-label classification model to reflect what a patent document could have multiple IPCs. Furthermore, we propose a method to classify patent documents at the IPC subclass level comprised of 630 categories so that we investigate the possibility of applying the IPC multi-label classification model into the real field. The effect of structural fields of patent documents are examined using 564,793 registered patents in Korea, and 87.2% precision is obtained in the case of using title, abstract, claims, technical field and background. From this sequence, we verify that the technical field and background have an important role in improving the precision of IPC multi-label classification in IPC subclass level.

Information Structuring of Diagram Repository for UML Diagrams (UML 다이어그램을 위한 다이어그램 레포지토리의 정보구조화)

  • Kim, Yun-Ho
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.23 no.12
    • /
    • pp.1588-1595
    • /
    • 2019
  • This paper presents the technique on structuring information of the diagram repository for UML diagrams. Because object interactions are the body of object-oriented programming, this paper handles especially the sequence diagrams and class diagrams among UML diagrams. Based on class diagrams, sequence diagrams represent the procedure of object interactions in run-time and then the corresponding codes are generated from the contents of those sequence diagrams. To do this work, this paper presents a method to construct the information repository for generating code from the contents of sequence diagrams. This paper classifies the five message types of sequence diagrams and then extracts the needed information including items and values on the corresponding message types for constructing message repositories. Because sequence diagram is composed of messages included, the final repository is constructed by collecting each of structured repositories on messages sequentially.

Research on creating information map for water-friendly facilities based on RS/GIS (RS/GIS 기반 친수시설 정보맵 작성 연구)

  • Kim, Seong Jun;Kim, Chang Sung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.222-222
    • /
    • 2021
  • 도시 내 하천 친수공간은 레저 및 여가를 위한 공간과 더불어 자연경관 및 생태체험 등의 다목적으로 활용되어 지역사회에 있어 중요한 공간으로 활용되고 있다. 과거 4대강 사업으로 국가하천 내 휴식공간을 조성하였다. 그 후 친수지구 중에서 이용도가 저조한 곳을 해제하였으며, 현재 297개의 친수지구를 중점으로 관리하고 있다. 이러한 친수지구를 유지하는데 필요한 보수 비용들을 지자체에서 담당하고 있으나, 상당한 비용이 소요되므로 친수지구 지정 후 운영단계에서 지역 주민들의 특성 및 요구를 정확히 파악할 필요가 있다. 하천 친수공간에 대한 정보구축은 조사원 조사, 유지관리 기관 조사 등 인적 조사 방식을 통한 데이터 수집으로 많은 비용이 필요할 뿐만아니라 DB 갱신 부분에도 한계가 있다. 그러므로 본 연구에서는 RS/GIS를 기반으로 친수시설에 대한 정보맵 작성 방안 연구와 친수시설 뿐만 아니라 유역조사 시 하천공간에서 수행할 수 있는 기술에 대한 연구를 수행하였다. 연구대상지역은 대저생태공원과 삼락생태공원을 대상으로 선정하였다. 해당 지역 항공영상의 정합 및 전처리를 실시한 후 QGIS를 활용하여 LSMS(Large-Scale Mean Shift) 기법으로 시설물 분류를 실시하였다. 공원 내 친수시설 분류를 위해 공간 반경(Spatial radius)를 10 ~ 25까지 변화시키면서 최적 분류 결과를 도출하는 공간 반경을 찾았으며 친수시설 규모와 시설의 특성에 따라 공간 반경을 조절하여 친수시설 분류맵을 작성하였다. 친수지구 내 친수시설 분류맵과 친수지구 내 친수시설 현황 및 친수시설별 코드와, 위치정보(위도, 경도 및 표고), 면적 및 관리현황으로 분류하여 입력 할 수 있도록 하였다. 본 연구에서 구축한 친수시설 자동분류 알고리즘을 통해 전국 단위 통합 하천관리체계 구축 및 친수시설에 대한 정보맵을 작성할 수 있는 기반 마련이 가능할 것이다.

  • PDF

An Automated Test Technique of GUI Based on Source Code (소스코드기반의 GUI 테스트 자동화 기법의 구현)

  • Moon, Joong-Hee;Lee, Nam-Yong
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.9
    • /
    • pp.697-705
    • /
    • 2009
  • A GUI automated test can be divided into two areas. The first one is a regression test automation and the second one is an automated test. The former includes generating test cases manually and executing them automatically but the latter includes both generating test cases and executing them automatically. Costs of a software test are increasing more and more. Many companies are searching for a test automation method but most used things are limited to regression test automation. So, when testing at first, there should be test cases which are drawn up by a human. This paper explains to make test cases based on a source code and execute them automatically. In this paper, the study proceeds with a digital television set-top box application and explains to test without any effort of human. Of course, this study is far from a realization to industries. But this paper has a contribution at reducing more human efforts than the previous regression test automation and showing that later, fully automated test can be possible.