• Title/Summary/Keyword: 자동 코드 분류

Search Result 79, Processing Time 0.032 seconds

BERT-based Classification Model for Korean Documents (한국어 기술문서 분석을 위한 BERT 기반의 분류모델)

  • Hwang, Sangheum;Kim, Dohyun
    • The Journal of Society for e-Business Studies
    • /
    • v.25 no.1
    • /
    • pp.203-214
    • /
    • 2020
  • It is necessary to classify technical documents such as patents, R&D project reports in order to understand the trends of technology convergence and interdisciplinary joint research, technology development and so on. Text mining techniques have been mainly used to classify these technical documents. However, in the case of classifying technical documents by text mining algorithms, there is a disadvantage that the features representing technical documents must be directly extracted. In this study, we propose a BERT-based document classification model to automatically extract document features from text information of national R&D projects and to classify them. Then, we verify the applicability and performance of the proposed model for classifying documents.

Digital photo management system using printed images (프린트 이미지를 이용한 디지털 사진 관리)

  • Kim, Hyun-Jin;Cho, Sung-Jung;Lee, Ho-Yul;Kim, Chang-Soo;Kim, Yun-Bae
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02b
    • /
    • pp.403-408
    • /
    • 2006
  • 디지털 카메라의 사용이 일반화되면서, 사용자가 사진을 찍고 보관하고 감상하는 행태가 과거의 일반 카메라와 다른 모습을 보이고 있다. 특히 디지털 카메라는 유지비가 거의 들지 않기 때문에 한번에 촬영하는 사진의 양이 많은 반면에 인쇄하여 보관하는 사진의 양은 매우 적은 경향을 보인다. 디지털 사진의 양이 방대하게 늘어나고, 인쇄하기 보다는 저장 장치에 보관하게 됨에 따라서 과거의 앨범에 인쇄된 사진을 보관하고 감상하던 방식과 감상하는 행태도 변화되었다. 디지털 카메라로 찍어서 하드디스크에 저장한 사진들은 각 폴더에 어떤 사진들이 들어 있는지를 기억하기 어렵기 때문에 앨범을 보는 것처럼 자주 감상하지 않게 되는 경향이 관찰되었고, 또 인쇄된 사진을 보고, 그 사진과 연관된 다른 사진들을 보고자 디지털로 저장되어 있는 하드디스크에 접속하는 경향이 관찰되었다. 본 연구에서는 촬영된 디지털 카메라의 사진을 분류하여 보관하고 감상하는 사용자의 행태를 분석하고, 이에 적합한 새로운 디지털 사진 관리 시스템을 제안하고자 한다. 특히, 자연스럽게 앨범을 넘겨보다가 인쇄된 디지털 사진과 관련된 컨텍스트를 갖는 다른 디지털 사진들을 저장 매체에서 바로 찾아서 디스플레이를 통해 감상할 수 있는 새로운 방식의 UI를 제안하였다. 이를 위해 인쇄된 사진에 사진의 컨텍스트 코드를 함께 인쇄하고, 추후에 출력된 사진의 컨텍스트 코드를 해독하여 원본 디지털 사진 및, 동일한 컨텍스트를 가지는 디지털 사진들을 자동으로 찾아서 디스플레이 하는 검색 및 감상 방식을 사용하였다. 이를 통해 디지털 사진을 감상하기 위해 거쳐야 했던 기존의 번거로운 과정을 단축하고 디지털 사진을 분류하여 보관하고 원하는 사진을 방대한 데이터 속에서 찾아야 하는 문제를 줄일 수 있었다.

  • PDF

A Study on the Development of Ontology based on the Jewelry Brand Information (귀금속.보석 상품정보 온톨로지 구축에 관한 연구)

  • Lee, Ki-Young
    • Journal of the Korea Society of Computer and Information
    • /
    • v.13 no.7
    • /
    • pp.247-256
    • /
    • 2008
  • This research is to develop product retrieval system through simplified communication by applying intelligent agent technology based on automatically created domain ontology to present solution on problems with e-commerce system which searches in the web documents with a simple keyword. Ontology development extracts representative term based on classification information of international product classification code(UNSPSC) and jewelry websites that is applied to analogy relationship thesaurus to establish standardized ontology. The intelligent agent technology is applied to retrieval stage to support efficiency of information collection for users by designing and developing e-commerce system supported with semantic web. Moreover, it designs user profile to personalized search environment and provide personalized retrieval agent and retrieval environment with inference function to make available with fast information collection and accurate information search.

  • PDF

Word Sense Disambiguation Based on Local Syntactic Relations and Sense Co-occurrence Information (국소 구문 관계 및 의미 공기 정보에 기반한 명사 의미 모호성 해소)

  • Kim, Young-Kil;Hong, Mun-Pyo;Kim, Chang-Hyun;Seo, Young-Ae;Yang, Seong-Il;Ryu, Chul;Huang, Yin-Xia;Choi, Sung-Kwon;Park, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.184-188
    • /
    • 2002
  • 본 논문에서는 단순히 주변에 위치하는 어휘들간의 문맥 공기 정보를 이용하는 방식과는 달리 국소 구문 관계 및 의미 공기 정보에 기반한 명사 의미 모호성 해소 방안을 제안한다. 기존의 WSD 방법은 구조 분석의 어려움으로 인하여 문장의 구문 관계를 충분히 고려하지 못하고 주변 어휘들과의 공기 관계로 그 의미를 파악하려 했다. 그러나 본 논문에서는 동사구의 논항 의미 관계뿐만 아니라 명사구내에서의 의미 관계도 고려한 국소 구문관계를 고려한 명사 의미 모호성 해소 방법을 제안한다. 이 때, 명사들의 의미는 자동번역 시스템의 목적에 맞게 공기(co-occurrence)하는 동사들에 따라 분류하였다. 그리고 한중 자동 번역 지식으로 사용되는 명사 의미 코드가 부착된 74,880 의미 격틀의 의미 공기정보를 이용하였으며 형태소 태깅된 말뭉치로부터 의미모호성이 발생하지 않게 의미 공기정보 및 명사구 의미 공기 정보를 자동으로 추출하였다. 실험 결과, 의미 모호성이 발생하는 명사들에 대해서 83.9%의 의미 모호성 해소 정확률을 보였다.

  • PDF

Design of Translator for generating Secure Java Bytecode from Thread code of Multithreaded Models (다중스레드 모델의 스레드 코드를 안전한 자바 바이트코드로 변환하기 위한 번역기 설계)

  • 김기태;유원희
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2002.06a
    • /
    • pp.148-155
    • /
    • 2002
  • Multithreaded models improve the efficiency of parallel systems by combining inner parallelism, asynchronous data availability and the locality of von Neumann model. This model executes thread code which is generated by compiler and of which quality is given by the method of generation. But multithreaded models have the demerit that execution model is restricted to a specific platform. On the contrary, Java has the platform independency, so if we can translate from threads code to Java bytecode, we can use the advantages of multithreaded models in many platforms. Java executes Java bytecode which is intermediate language format for Java virtual machine. Java bytecode plays a role of an intermediate language in translator and Java virtual machine work as back-end in translator. But, Java bytecode which is translated from multithreaded models have the demerit that it is not secure. This paper, multhithread code whose feature of platform independent can execute in java virtual machine. We design and implement translator which translate from thread code of multithreaded code to Java bytecode and which check secure problems from Java bytecode.

  • PDF

Machine Learning-Based Malicious URL Detection Technique (머신러닝 기반 악성 URL 탐지 기법)

  • Han, Chae-rim;Yun, Su-hyun;Han, Myeong-jin;Lee, Il-Gu
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.32 no.3
    • /
    • pp.555-564
    • /
    • 2022
  • Recently, cyberattacks are using hacking techniques utilizing intelligent and advanced malicious codes for non-face-to-face environments such as telecommuting, telemedicine, and automatic industrial facilities, and the damage is increasing. Traditional information protection systems, such as anti-virus, are a method of detecting known malicious URLs based on signature patterns, so unknown malicious URLs cannot be detected. In addition, the conventional static analysis-based malicious URL detection method is vulnerable to dynamic loading and cryptographic attacks. This study proposes a technique for efficiently detecting malicious URLs by dynamically learning malicious URL data. In the proposed detection technique, malicious codes are classified using machine learning-based feature selection algorithms, and the accuracy is improved by removing obfuscation elements after preprocessing using Weighted Euclidean Distance(WED). According to the experimental results, the proposed machine learning-based malicious URL detection technique shows an accuracy of 89.17%, which is improved by 2.82% compared to the conventional method.

Implementation of An Automatic Authentication System Based on Patient's Situations and Its Performance Evaluation (환자상황 기반의 자동인증시스템 구축 및 성능평가)

  • Ham, Gyu-Sung;Joo, Su-Chong
    • Journal of Internet Computing and Services
    • /
    • v.21 no.4
    • /
    • pp.25-34
    • /
    • 2020
  • In the current medical information system, a system environment is constructed in which Biometric data generated by using IoT or medical equipment connected to a patient can be stored in a medical information server and monitored at the same time. Also, the patient's biometric data, medical information, and personal information after simple authentication using only the ID / PW via the mobile terminal of the medical staff are easily accessible. However, the method of accessing these medical information needs to be improved in the dimension of protecting patient's personal information, and provides a quick authentication system for first aid. In this paper, we implemented an automatic authentication system based on the patient's situation and evaluated its performance. Patient's situation was graded into normal and emergency situation, and the situation of the patient was determined in real time using incoming patient biometric data from the ward. If the patient's situation is an emergency, an emergency message including an emergency code is send to the mobile terminal of the medical staff, and they attempted automatic authentication to access the upper medical information of the patient. Automatic authentication is a combination of user authentication(ID/PW, emergency code) and mobile terminal authentication(medical staff's role, working hours, work location). After user authentication, mobile terminal authentication is proceeded automatically without additional intervention by medical staff. After completing all authentications, medical staffs get authorization according to the role of medical staffs and patient's situations, and can access to the patient's graded medical information and personal information through the mobile terminal. We protected the patient's medical information through limited medical information access by the medical staff according to the patient's situation, and provided an automatic authentication without additional intervention in an emergency situation. We performed performance evaluation to verify the performance of the implemented automatic authentication system.

The Development of Generalization Processing Using Digital Map Ver 2.0 (수치지도 Ver 2.0을 이용한 일반화 처리공정 개발)

  • 이재기;최석근;박기석
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.21 no.1
    • /
    • pp.37-44
    • /
    • 2003
  • This study is focused on development of generalization processing for 1/25,000 digital mapping using l/5,000 digital map. The generalization processing for digital map included in spatial and attribute information consists of 3 steps. The first, elimination of layer which is not included in 1/25,000 feature code. The second, classification of 8 feature codes. The third, merging of spatial and attribute information. Therefore using generalization workflow developed in this project, automatic generalization system will develope optimal in the future and also contribute product to small scale digital map and thematic map.

Storm sewer network simplification technique for improving efficiency of urban flood forecasting (도시침수예측 효율 향상을 위한 관망간소화 기법 제시)

  • Sang Bo Sim;Hyung-Jun Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.269-269
    • /
    • 2023
  • 기후 변화로 인한 강우 패턴의 변화는 도심지 방재성능 목표를 상회하는 홍수로 이어져 침수피해를 가중시키고 있다. 이로 인한 도시침수 피해를 저감하기 위하여 도시침수 예측모형 개발이 활발히 이루어지고 있으나, 대규모 관망으로 이루어진 복잡한 도심지 우수관망을 모의하기 때문에 분석속도가 느려 실시간 예측 적용에 한계점이 있다. 도시침수 분석에 가장 많이 활용되는 대표적인 모형인 SWMM(Storm Water Management Model)은 복잡한 관망을 비교적 빠르고 정확히 해석할 수 있어 유용하지만, 이 또한 대도심의 우수관망 모의 시 많은 시간이 소요되며, 관망 정밀도 기준이 정의되어 있지 않아 분석에 어려움이 있다. 이러한 문제점을 해결하기 위하여 본 연구에서는 관망 간소화 기법(유역면적의 밀도, 관거 직경, 관로의 길이 등)을 적용하고, 이에 따른 주요 지선과 간선의 수위 변화와 침수흔적도를 비교하여 분석결과의 정확성을 담보하는 관망 간소화 수준을 파악하고 도시침수 분석 시 적정 간소화 기준과 자동 간소화 방안을 제시하고자 한다. 도시침수 분석 시 우수관망 자동 간소화를 위하여 Python을 활용한 코드를 작성하였으며, SWMM의 .inp 파일을 읽어들여 Dataframe형태로 저장한 후 분석을 위한 데이터 가공, 간소화 기준에 따른 분류, 간소화 대상 수리·수문인자 연산, 인접 간선에 연결, 간소화된 .inp파일 저장의 총 6단계로 구성하였다. 연구 대상지역은 도림천 유역으로 설정하였으며, 초기자료는 맨홀 30,469, 관거 32,443, 소유역 30,586개로 이루어져 있으며, 모의 시간은 약 2시간 30분이 소요되었다. 유역면적 100x100 미만을 대상으로 수행 시 맨홀 9,965, 관거 10,464, 소유역 9,240개로 관거의 복잡도가 약 1/3 감소하였으며, 모의 시간은 약 43분으로 기존대비 약 72% 단축되는 것으로 나타났다. 실제 침수가 발생한 주요지점들을 비교한 결과 R2 0.85 ~ 0.92로 예측모형의 정확도에 큰 영향을 끼치지 않는 것으로 나타났다. 도시침수모형 최적 간소화를 통해 모형의 복잡성을 줄이고, 계산량을 줄여 모형의 수행시간을 단축시킬 수 있으며, 불필요한 우수관망을 제거하거나 병합함으로써, 모형의 예측력 향상과 분석과 해석에 효율적으로 사용될 수 있을 것으로 기대한다.

  • PDF

A Concept of Multi-Layered Database for the Maintenance and Management of Bridges (교량의 유지관리를 위한 멀티레이어 데이터베이스 개념)

  • Kim, Bong-Geun;Yi, Jin-Hoon;Lee, Sang-Ho
    • Journal of the Computational Structural Engineering Institute of Korea
    • /
    • v.20 no.3
    • /
    • pp.393-404
    • /
    • 2007
  • A concept of multi-layered database is proposed for the integrated operation of bridge information in this study. The multi-layered database is a logically integrated database composed of standardized information layers. The standardized information layers represent the data sets that can be unified, and they are defined by standardized information models. Classification system of bridge component was used as a basis of the multi-layered database, and code system based on the classification system was employed as a key integrator to manipulate the distributed data located on the different information layers. In addition, data level indicating priorities of information layers was defined to support strategic planning of the multi-layered database construction. As a proof of concept, a prototype of multi-layered database for object-oriented 3-D shape information and structural calculation document was built. Data consistency check of the semantically same data in the two different information layer was demonstrated, It is expected that the proposed concept can assure the integrity and consistency of information in the bridge information management.