• 제목/요약/키워드: Language Models

검색결과 872건 처리시간 0.028초

Improving the Classification of Population and Housing Census with AI: An Industry and Job Code Study

  • Byung-Il Yun;Dahye Kim;Young-Jin Kim;Medard Edmund Mswahili;Young-Seob Jeong
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.21-29
    • /
    • 2023
  • 본 논문에서는 인구 조사에서 산업 및 직업 코드를 자동 분류하기 위한 인공지능 기반 시스템을 제안한다. 산업 및 직업 코드의 정확한 분류는 정책 결정, 자원 할당 및 연구를 위해 매우 중요하지만, 기존의 방식은 사람이 작성한 사례 사전에 의존하는 규칙 기반 방식으로 규칙 생성에 필요한 시간과 자원이 많이 소요되며 오류 발생 가능성이 높다. 우리는 본 논문에서 통계 기관에서 사용하는 기존의 규칙 기반 시스템을 대체하기 위해 사용자가 입력한 데이터를 이용하는 인공지능 기반 시스템을 제안하였다. 이 논문에서는 여러 모델을 학습하고 평가하여 산업에서 86.76%의 일치율, 직업에서 81.84%의 일치율을 달성한 앙상블 모델을 개발하였다. 또한, 분류 확률 결과를 기반으로 프로세스 개선 작업도 제안하였다. 우리가 제안한 방법은 전이 학습 기술을 활용하여 사전 학습된 모델과 결합하는 앙상블 모델을 사용하였으며, 개별 모델과 비교하여 앙상블 모델의 성능이 더 높아짐을 보였다. 본 논문에서는 인공지능 기반 시스템이 인구 조사 데이터 분류의 정확성과 효율성을 향상시키는 잠재력을 보여주며, 인공지능으로 이러한 프로세스를 자동화함으로써 더 정확하고 일관된 결과를 달성하며 기관 직원의 작업 부담을 줄일 수 있다는 점을 보여준다.

차량 보안을 위한 어구독립 화자증명의 등록시간 단축에 관한 연구 (A Study on the Fast Enrollment of Text-Independent Speaker Verification for Vehicle Security)

  • 이태승;최호진
    • 한국항행학회논문지
    • /
    • 제5권1호
    • /
    • pp.1-10
    • /
    • 2001
  • 음성은 차량 운행시 여러 가지 조작으로 분주한 운전자에게 간편한 장비 입력 및 조작을 위한 수단으로 유용한 특성을 지니고 있다. 본 논문에서는 이런 음성의 특성을 이용하여 차량 도난이나 중요한 온라인 서비스 접근시 신원을 증명할 수 있는 화자증명 방식을 제안한다. 이 방식에서는 음성의 언어정보를 이용하는 지속음 인식 기법과 함께 확률적 인식 방식에 비해 몇 가지 이점을 갖는 MLP(multi-layer perceptron)를 사용한다. 하지만 MLP를 사용하는 인식 기법은 학습에 많은 계산량을 요구하므로 실시간으로 화자를 등록해야 하는 화자증명에서는 적용하기가 쉽지 않다. 이 문제를 해결하기 위해 본 논문에서는 기존의 화자점수 평준화 방법에서 화자군집 모델 기법을 도입하여 배경화자를 사전에 여러 개의 작은 화자군집으로 분리하는 방법을 제안한다. 등록화자를 이렇게 나눈 화자군집 중 하나로 분류한 뒤 해당 화자군집에 대해서만 등록 학습과정을 거치는 방법으로 계산량을 큰 폭으로 줄일 수 있다.

  • PDF

다형의 버그 추적 시스템 마이닝 및 분석을 위한 저장소 독립 모델 설계 (Designing a Repository Independent Model for Mining and Analyzing Heterogeneous Bug Tracking Systems)

  • 이재권;정우성
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.103-115
    • /
    • 2014
  • 본 논문은 다양한 버그 추적 시스템으로부터 추출한 데이터를 통합하여 단일 저장소 모델을 제공하는 UniBAS(Unified Bug Analysis System)를 제안한다. UniBAS는 MSR(Mining Software Repositories) 연구 과정에서의 저장소 추출, 데이터 가공이나 모델 생성과 같은 공통적인 반복 작업을 줄이고, 관련 연구자가 상위 수준의 연구에 보다 집중할 수 있도록 함으로써 해당 연구 수행에 발생하는 복잡도와 비용을 줄여준다. 또한, UniBAS는 데이터 추출 뿐 아니라 질의 기반 분석에 필요한 테이블, 뷰 및 저장 프로시저 등을 자동 생성하며, 수집한 데이터 관리와 외부 도구와의 연동을 위해 다양한 형식의 파일을 생성할 수 있다. 사례 연구로 UniBAS의 유용성을 검증하기 위해 Mozilla사이트의 Firefox프로젝트를 대상으로 실제 중복 버그 리포트를 탐지하는 실험을 진행하였다. 이 과정에서 자동 추출된 자료를 대상으로 질의와 분석이 유연하게 이루어질 수 있었으며, 다양한 자연어 처리 알고리즘 적용을 통해 유효한 실험 결과를 얻을 수 있었다.

ACT-R Predictive Model of Korean Text Entry on Touchscreen

  • Lim, Soo-Yong;Jo, Seong-Sik;Myung, Ro-Hae;Kim, Sang-Hyeob;Jang, Eun-Hye;Park, Byoung-Jun
    • 대한인간공학회지
    • /
    • 제31권2호
    • /
    • pp.291-298
    • /
    • 2012
  • Objective: The aim of this study is to predict Korean text entry on touchscreens using ACT-R cognitive architecture. Background: Touchscreen application in devices such as satellite navigation devices, PDAs, mobile phones, etc. has been increasing, and the market size is expanding. Accordingly, there is an increasing interest to develop and evaluate the interface to enhance the user experience and increase satisfaction in the touchscreen environment. Method: In this study, Korean text entry performance in the touchscreen environment was analyzed using ACT-R. The ACT-R model considering the characteristics of the Korean language which is composed of vowels and consonants was established. Further, this study analyzed if the prediction of Korean text entry is possible through the ACT-R cognitive model. Results: In the analysis results, no significant difference on performance time between model prediction and empirical data was found. Conclusion: The proposed model can predict the accurate physical movement time as well as cognitive processing time. Application: This study is useful in conducting model-based evaluation on the text entry interface of the touchscreen and enabled quantitative and effective evaluation on the diverse types of Korean text input interfaces through the cognitive models.

전문가의 형태소 분류를 활용한 과학 논증 자동 채점 (Automated Scoring of Scientific Argumentation Using Expert Morpheme Classification Approaches)

  • 이만형;유선아
    • 한국과학교육학회지
    • /
    • 제40권3호
    • /
    • pp.321-336
    • /
    • 2020
  • 본 연구는 실제 교실에서 이루어진 학생의 과학 논증과정을 기계학습을 활용한 자동 채점에 적용함으로써, 논증 자동 채점의 가능성 및 개선 방향을 탐색한다. 분자 구조에 대한 고등학생의 과학 논증수업 중 발생한 2,605개의 모든 발화를 대상으로 연구를 진행하였다. 지도 학습을 위해 5가지의 논증 요소로 발화를 분류하였고, 분류된 발화를 대상으로 텍스트 전처리를 수행하였다. 전처리된 학생 발화를 활용하여 서포트 벡터 머신, 의사결정나무, 랜덤 포레스트, 인공신경망의 기계 학습 방법으로 자동 채점 모델을 구성하였다. 불용어 처리가 되지 않은 학생 발화를 활용한 자동 채점의 결과 랜덤 포레스트의 정확도는 65.96%, kappa는 0.5298의 유미한 결과를 얻었다. 불용어 처리를 수행한 학생 발화를 활용한 새로운 채점 모델의 결과 채점의 정확도가 크게 변화하지 않음에도 논증 발화 중 과학 용어 및 논증 요소의 담화표지가 채점 모델의 분류 기준이 되는 결과를 얻었다. 또한 인간 전문가의 논증 채점 과정을 분석하여 얻어진 전문가 형태소를 자동 채점 모델에 생성 규칙 알고리즘으로 적용하였다. 그 결과 의사결정나무에서 반박에 대한 재현율(recall)이 21.74% 증가하였다. 이에 본 연구 결과는 과학 교육 연구에서 기계 학습 및 논증에 대한 자동 채점의 활용 가능성과 연구 방향성을 제안하였다.

컴퓨터 프로그램 교육에서 자기조절 학습 모델 개발 (A Self-regulated Learning Model Development in Computer Programming Education)

  • 김갑수
    • 정보교육학회논문지
    • /
    • 제19권1호
    • /
    • pp.21-30
    • /
    • 2015
  • 21세기 지식 정보 사회에 컴퓨터 교육이 매우 중요하다. 컴퓨터 교육에서 컴퓨터 프로그래밍 교육이 매우 중요하다. 컴퓨터 프로그래밍 교육에는 교수 학습 모델이 거의 없다. 본 연구에서는 학생들이 자기조절 학습을 할 수 있는 자기 조절 학습 모형을 개발한다. 본 연구에서는 자기 조절 학습 요소, 자기 조절 학습 단계와 자기 조절 학습 모형을 제안한다. 자기조절 학습 요소는 과제 수준, 일반화, 효율화이다. 자기조절 학습 단계는 문제이해, 설계, 코딩, 시험, 유지보수이다. 자기조절 학습 모델은 복사하기, 변형하기, 창조하기, 도전하기이다. 본 연구의 결과는 다음과 같다. 학습 요소들과 성취도간의 상관관계 분석은 효율화와 일반화가 과제 수준보다 더 높았다. 학습 단계에는 문제 이해와 설계 단계가 다른 단계보다 더 높았다. 학습 모형에서는 변형하기, 창조하기, 도전하기가 구현하기보다 상관관계가 더 높았다.

GPS 실시간 구조물 모니터링을 위한 반송파 관측데이터 순간미지정수 결정 (An Instantaneous Integer Ambiguity Resolution for GPS Real-Time Structure Monitoring)

  • 이흥규
    • 대한토목학회논문집
    • /
    • 제34권1호
    • /
    • pp.341-353
    • /
    • 2014
  • GPS 반송파를 사용하여 센티미터 수준 정확도의 동적 측위를 위해서는 반송파 관측데이터에 포함하고 있는 미지정수를 결정하여 정밀한 기하거리로 환산하는 것이 필수적이다. 본 논문에서는 GPS에 의한 실시간 구조물 모니터링에 효율적으로 적용가능한 반송파 관측데이터 순간미지정수 결정 성능향상을 위한 알고리즘을 연구하였다. 이를 위하여 구조물에 설치한 GPS 수신기 이동 범위와 그 네트워크를 수학적으로 모형화하고 '정수제약 최소제곱법'을 통해 정확한 위치를 추정하는 절차를 제안하였다. 이 절차에는 추정해의 신뢰성 향상을 위해 실수해의 과대오차 최소화에 필요한 품질제어와 기하적 구속조건을 이용한 미지정수 타당성 검정을 포함하고 있다. 제안된 순간미지정수 결정절차를 과학기술용 계산용 소프트웨어인 MATLAB에 의해 실시간 적용 가능하도록 구현하고 장대교량에 해당하는 사장교 현장 관측데이터를 처리하여, 그 성능을 미지정수결정 성공률, 통계모형의 영향 그리고 연산시간에 대해 분석하고 결과를 요약하였다.

AeroMACS 시스템을 위한 동기화기 설계 (Design and Implementation of Synchronization Unit for AeroMACS System)

  • 장수현;이은상;정윤호
    • 한국항행학회논문지
    • /
    • 제18권2호
    • /
    • pp.142-150
    • /
    • 2014
  • 본 논문에서는 항공관제통신용 AeroMACS 시스템을 위한 시간/주파수 동기 획득 및 기지국 셀탐색 알고리즘을 분석하고, AeroMACS 채널 모델에서 동기 알고리즘의 성능 평가를 진행하였다, 그리고, 상기 알고리즘을 이용한 AeroMACS 시스템용 동기화기를 설계 및 구현하였다. AeroMACS 시스템은 IEEE 802.16e mobile WiMAX 규격에 기반 된 시스템이나, WiMAX 시스템과 달리 5GHz 항공 주파수 대역에서 5MHz의 대역폭을 활용하여 통신을 수행한다. 변경된 사양에 따른 시스템 모델링 후에 apron (APR), runway (RWY), taxiway (TWY), park (PRK) 등 다양한 공항 환경에 대한 채널 모델에 기반하여 시간 및 주파수 동기 알고리즘 및 셀 탐색 알고리즘의 성능 평가를 수행하였다. 그리고, 이를 FPGA 기반 실시간 구현 및 검증하였다.

웹 응용 프로그램의 문자열 삽입 보안 취약성 분석기 개발 (Development of a String Injection Vulnerability Analyzer for Web Application Programs)

  • 안준선;김영민;조장우
    • 정보처리학회논문지A
    • /
    • 제15A권3호
    • /
    • pp.181-188
    • /
    • 2008
  • 오늘날 대부분의 웹사이트는 웹 응용 프로그램이 적절한 웹 페이지를 생성하여 전송하는 형태인 동적 웹페이지를 사용하고 있다. 이에 대하여, 취약한 웹 응용 프로그램에 악의적인 문자열을 전달하는 공격의 형태가 증가하고 있다. 본 논문에서는 대표적인 문자열 삽입 공격인 SQL 삽입(SQL Injection) 공격과 크로스 사이트 스크립팅(Cross Site Scripting, XSS) 공격에 대하여 웹 응용 프로그램내의 보안 취약성을 자동으로 찾아 주는 프로그램 정적 분석기를 개발하였다. 요약 해석을 사용한 프로그램 분석을 위하여 가능한 문자열 값을 제외 문자열들과 함께 표현하는 요약 자료 공간과 PHP 언어의 요약된 의미 규칙을 설계하였으며, 이를 기반으로 분석기를 구현하였다. 또한 개발된 분석기가 기존의 연구 결과와 비교하여 경쟁력 있는 분석 속도와 정밀도를 가짐을 실험을 통하여 보였다.

Flanders 언어상호작용 분석법을 활용한 수학영재 수업 분석 (Analysis on Gifted Class in Mathematics using Flanders Category System)

  • 이윤경;이중권
    • 한국콘텐츠학회논문지
    • /
    • 제14권5호
    • /
    • pp.512-523
    • /
    • 2014
  • 본 연구는 Flanders 언어상호작용 분석법을 활용하여 대학부설영재원 수학영재 수업에서 교수-학생 간의 언어적 상호작용을 분석한다. 연구문제는 수학영재 수업의 1)Flanders 코드 항목별 결과는 어떠한가? 2)언어형태는 어떠한가? 3)Flanders 지수결과는 어떠한가? 연구대상은 대학부설 영재교육원 중등 수학반 수업이며, 수업과정을 비디오 녹화한 동영상을 AF분석 프로그램 3.54를 활용하여 분석한 결과 1)Flanders 코드 항목별 분석결과, 교사의 비지시적 발언보다 지시적 발언이, 학생의 반응적인 발언보다 자진적인 발언이 많은 것으로 나타났고, 분류 항목별 빈도수는 강의, 학생의 자진적인 말, 활동 등이 전체수업의 대부분을 차지하였다. 2)수업 흐름은 대체적으로 바람직한 수업 흐름 모델을 따르지 않는 것으로 나타나, 학생 발언에 대한 교사의 적절한 피드백이 요구된다. 3)지수 분석 결과, 수정 비지시, 교사 질문비, 학생 발언비, 학생 질문 및 넓은 답변비는 분석기준보다 높게 나타났고, 비지시는 분석 기준보다 낮게 나타났다.