• 제목/요약/키워드: Performance benchmark

검색결과 845건 처리시간 0.035초

수학.과학 성취도 추이변화 국제 비교 연구(TIMSS 2003)에서 우리나라 중학생들의 과학 성취도 분석 (An Analysis of Korean Middle School Student Science Achievement in Trends in International Mathematics and Science Study (TIMSS 2003))

  • 정은영;박정;김경희
    • 한국과학교육학회지
    • /
    • 제26권1호
    • /
    • pp.99-113
    • /
    • 2006
  • 이 연구는 수학 과학 성취도 추이변화 국제 비교 연구(TIMSS 2003)에서 우리나라 중학생들의 과학 성취도의 국제적 수준 및 추이 변화를 파악하고, 내용 영역별 성취도 및 남 여학생의 성취도 차이를 분석하며, 과학의 정의적 영역에서 성취를 비교함으로써 우리나라 과학 교육 개선에 대한 시사점을 얻고자 하였다. 우리나라 중학생의 과학 성취도는 558점으로, 싱가포르, 대만에 이어 3위를 차지하였다. 그리고 TIMSS 1995, TIMSS 1999, TIMSS 2003에 이르면서 과학성취도 점수가 높아졌고 전체 순위도 높아졌다. 우리나라 중학생들은 물리 영역에서 연구 참여국 가운데 가장 높은 점수를 받았지만, 화학 영역의 성취도 순위는 9위로 나타났고, 추이 변화 결과에서 화학 영역의 성취도가 유의하게 감소하였다. 한편 수윌 수준의 학생 비율이 싱가포르나 대만에 비교할 때 상대적으로 낮았고, 우리나라 남 여학생의 과학 성취도 차이가 점점 줄어드는 추세에 있기는 하나, 여전히 그 차이가 비교적 큰 편이었다. 또한 과학 학습에 대한 자신감, 과학에 대한 가치 인식, 과학 학습의 즐거움 등 정의적 영역에서의 성취가 매우 낮은 편이었다. 이러한 결과에 근거하여 수윌성 교육, 과학 교육과정 내용 체계에 대한 논의, 여학생의 과학 성취도 향상 방안, 과학에 대한 태도 향상 방안 등의 필요성이 제기된다.

데이터 세트별 Post-Training을 통한 언어 모델 최적화 연구: 금융 감성 분석을 중심으로 (Optimizing Language Models through Dataset-Specific Post-Training: A Focus on Financial Sentiment Analysis)

  • 정희도;김재헌;장백철
    • 인터넷정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.57-67
    • /
    • 2024
  • 본 연구는 금융 분야에서 중요한 증감 정보를 효과적으로 이해하고 감성을 정확하게 분류하기 위한 언어 모델의 학습 방법론을 탐구한다. 연구의 핵심 목표는 언어 모델이 금융과 관련된 증감 표현을 잘 이해할 수 있게 하기 위한 적절한 데이터 세트를 찾는 것이다. 이를 위해, Wall Street Journal에서 수집한 금융 뉴스 문장 중 증감 관련 단어를 포함하는 문장을 선별했고, 이와 함께 적절한 프롬프트를 사용해 GPT-3.5-turbo-1106으로 생성한 문장을 각각 post-training에 사용했다. Post-training에 사용한 데이터 세트가 언어 모델의 학습에 어떠한 영향을 미치는지 금융 감성 분석 벤치마크 데이터 세트인 Financial PhraseBank를 통해 성능을 비교하며 분석했으며, 그 결과 금융 분야에 특화된 언어 모델인 FinBERT를 추가 학습한 결과가 일반적인 도메인에서 사전 학습된 모델인 BERT를 추가 학습한 것보다 더 높은 성능을 보였다. 또 금융 뉴스로 post-training을 진행한 것이 생성한 문장을 post-training을 진행한 것에 비해 전반적으로 성능이 높음을 보였으나, 일반화가 더욱 요구되는 환경에서는 생성된 문장으로 추가 학습한 모델이 더 높은 성능을 보였다. 이러한 결과는 개선하고자 하는 부분의 도메인이 사용하고자 하는 언어 모델과의 도메인과 일치해야 한다는 것과 적절한 데이터 세트의 선택이 언어 모델의 이해도 및 예측 성능 향상에 중요함을 시사한다. 연구 결과는 특히 금융 분야에서 감성 분석과 관련된 과제를 수행할 때 언어 모델의 성능을 최적화하기 위한 방법론을 제시하며, 향후 금융 분야에서의 더욱 정교한 언어 이해 및 감성분석을 위한 연구 방향을 제시한다. 이러한 연구는 금융 분야 뿐만 아니라 다른 도메인에서의 언어 모델 학습에도 의미 있는 통찰을 제공할 수 있다.

지식베이스 확장을 위한 멀티소스 비정형 문서에서의 정보 추출 시스템의 개발 (Development of Information Extraction System from Multi Source Unstructured Documents for Knowledge Base Expansion)

  • 최현승;김민태;김우주;신동욱;이용훈
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.111-136
    • /
    • 2018
  • 지식베이스를 구축하는 작업은 도메인 전문가가 온톨로지 스키마를 이해한 뒤, 직접 지식을 정제하는 수작업이 요구되는 만큼 비용이 많이 드는 활동이다. 이에, 도메인 전문가 없이 다양한 웹 환경으로부터 질의에 대한 답변 정보를 추출하기 위한 자동화된 시스템의 연구개발의 필요성이 제기되고 있다. 기존의 정보 추출 관련 연구들은 웹에 존재하는 다양한 형태의 문서 중 학습데이터와 상이한 형태의 문서에서는 정보를 효과적으로 추출하기 어렵다는 한계점이 존재한다. 또한, 기계 독해와 관련된 연구들은 문서에 정답이 있는 경우를 가정하고 질의에 대한 답변정보를 추출하는 경우로서, 문서의 정답포함 여부를 보장할 수 없는 실제 웹의 비정형 문서로부터의 정보추출에서는 낮은 성능을 보인다는 한계점이 존재한다. 본 연구에서는 지식베이스 확장을 위하여 웹에 존재하는 멀티소스 비정형 문서로부터 질의에 대한 정보를 추출하기 위한 시스템의 개발 방법론을 제안하고자 한다. 본 연구에서 제안한 방법론은 "주어(Subject)-서술어(Predicate)"로 구분된 질의에 대하여 위키피디아, 네이버 백과사전, 네이버 뉴스 3개 웹 소스로부터 수집된 비정형 문서로부터 관련 정보를 추출하며, 제안된 방법론을 적용한 시스템의 성능평가를 위하여, Wu and Weld(2007)의 모델을 베이스라인 모델로 선정하여 성능을 비교분석 하였다. 연구결과 제안된 모델이 베이스라인 모델에 비해, 위키피디아, 네이버 백과사전, 네이버 뉴스 등 다양한 형태의 문서에서 정보를 효과적으로 추출하는 강건한 모델임을 입증하였다. 본 연구의 결과는 현업 지식베이스 관리자에게 지식베이스 확장을 위한 웹에서 질의에 대한 답변정보를 추출하기 위한 시스템 개발의 지침서로서 실무적인 시사점을 제공함과 동시에, 추후 다양한 형태의 질의응답 시스템 및 정보추출 연구로의 확장에 기여할 수 있을 것으로 기대한다.

RNN(Recurrent Neural Network)을 이용한 기업부도예측모형에서 회계정보의 동적 변화 연구 (Dynamic forecasts of bankruptcy with Recurrent Neural Network model)

  • 권혁건;이동규;신민수
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.139-153
    • /
    • 2017
  • 기업의 부도는 이해관계자들뿐 아니라 사회에도 경제적으로 큰 손실을 야기한다. 따라서 기업부도예측은 경영학 연구에 있어 중요한 연구주제 중 하나로 다뤄져 왔다. 기존의 연구에서는 부도 예측을 위해 다변량판별분석, 로짓분석, 신경망분석 등 다양한 방법론을 이용하여 모형의 부도 예측력을 높이고 과적합의 문제를 해결하고자 시도하였다. 하지만 기존의 연구들이 시간적 요소를 고려하지 않아 발생할 수 있는 문제점들을 갖고 있음에도 불구하고 부도 예측에 있어서 동적 모형을 이용한 연구는 활발히 진행되고 있지 않으며 따라서 동적 모형을 이용하여 부도예측모형이 더욱 개선될 여지가 있다는 점을 확인할 수 있었다. 이에 본 연구에서는 RNN(Recurrent Neural Network)을 이용하여 시계열 재무 데이터의 동적 변화를 반영한 모형을 만들었으며 기존의 부도예측모형들과의 비교분석을 통해 부도 예측력의 향상에 도움이 된다는 것을 확인할 수 있었다. 모형의 유용성을 검증하기 위해 KIS Value의 재무 데이터를 이용하여 실험을 수행하였고 비교모형으로는 다변량판별분석, 로짓분석, SVM, 인공신경망을 선정하였다. 실험 결과 제안된 모형이 비교 모형에 비해 우수한 예측력을 보이는 것으로 나타났다. 따라서 본 연구는 변수들의 변화를 포착하는 동적 모형을 부도예측에 새롭게 제안하여 부도예측 연구의 발전에 기여할 수 있을 것으로 기대된다.

다목적 유전자알고리즘을 이용한 스마트 TMD의 퍼지제어 (Fuzzy Control of Smart TMD using Multi-Objective Genetic Algorithm)

  • 강주원;김현수
    • 한국전산구조공학회논문집
    • /
    • 제24권1호
    • /
    • pp.69-78
    • /
    • 2011
  • 본 연구에서는 스마트 TMD를 효과적으로 제어할 수 있는 퍼지제어알고리즘을 개발하기 위하여 다목적 유전자알고리즘을 이용한 최적화기법을 제안하였다. 예제구조물로는 풍하중을 받는 76층 벤치마크건물을 선택하였다. 스마트 TMD를 구성하기 위하여 100kN 용량의 MR 감쇠기를 사용하였고, 스마트 TMD의 진동주기는 예제구조물의 1차모드 고유진동주기에 맞추어 조율되었다. MR 감쇠기의 감쇠력은 예제구조물의 풍응답을 최소화할 수 있도록 퍼지제어기를 통해서 조절된다. 퍼지제어기의 입력변수는 75층의 가속도 응답과 스마트 TMD의 변위응답으로 하였고, 출력변수는 MR 감쇠기로 전달되는 명령전압으로 하였다. 퍼지제어기의 최적화를 위하여 다목적 유전자알고리즘인 NSGA-II 기법이 사용되었고, 이때 75층의 가속도 응답과 스마트 TMD의 변위응답을 목적함수로 사용하였다. 최적화 결과, 구조물의 풍응답과 STMD의 변위응답을 동시에 적절히 제어할 수 있는 다수의 퍼지제어기를 얻을 수 있었다. 수치해석을 통해서 스마트 TMD의 성능이 수동 TMD에 비하여 월등히 뛰어남을 알 수 있었고 경우에 따라서는 샘플 능동 TMD보다 더 우수한 제어성능을 발휘하였다.

실내공간 이동객체 궤적 생성기 (Synthetic Trajectory Generation Tool for Indoor Moving Objects)

  • 류형규;김수진;이기준
    • 대한공간정보학회지
    • /
    • 제24권4호
    • /
    • pp.59-66
    • /
    • 2016
  • 이동객체에 관한 연구를 위하여서는 이동객체 데이터가 필요하다. 예를 들어 이동객체 질의처리 방법의 성능연구를 위하여서는 이동객체의 벤치마크 데이터가 있어야 실험이 가능하다. 이러한 이유로 도로나 실외 공간을 움직이는 가상의 이동객체를 성성하는 도구가 만들어졌다. 반면에 실내공간은 실외공간과 달리 독특한 특징을 가지고 있으며, 실내공간 이동객체 데이터 생성기는 이를 반영하여 만들어져야 한다. 지금까지 몇 개의 실내공간에 대한 이동객체 생성기가 개발되었으나, 이동궤적이 사실적이지 않은 문제점이 있다. 이러한 배경에서 본 논문에서는 실내공간의 가상적 이동객체를 생성하는 도구를 소개한다. 이 도구는 다음과 같은 특징을 가지고 있다. 첫번째, 이동객체는 보행자를 위하여 설정하였다. 두 번째로 다양한 이동객체의 요소를 변수모델로 표현할 수 있도록 하였다. 보행자의 수, 보행자 평균속도와 같이 단순한 것에서 보행자 사이의 최소거리, 이동 패턴과 같은 복잡한 내용을 사용자가 변수로 설정할 수 있도록 하였다. 세 번째로, 보행자의 현실적인 특징을 반영하도록 노력하였다. 그리고, 마직막으로 데이터의 상호운영성을 위하여 국제공간정보 표준인 IndoorGML로 표현된 실제 대규모 쇼핑몰의 실내공간을 대상으로 이동객체 데이터의 생성을 적용하여보았다.

제목을스마트 시설환경 실시간 제어를 위한 마이크로 병렬 컴퓨팅 기술 분석 (A Benchmark of Micro Parallel Computing Technology for Real-time Control in Smart Farm (MPICH vs OpenMP))

  • 민재기;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.161-161
    • /
    • 2017
  • 스마트 시설환경의 제어 요소는 난방기, 창 개폐, 수분/양액 밸브 개폐, 환풍기, 제습기 등 직접적으로 시설환경의 조절에 관여하는 인자와 정보 교환을 위한 통신, 사용자 인터페이스 등 간접적으로 제어에 관련된 요소들이 복합적으로 존재한다. PID 제어와 같이 하는 수학적 논리를 바탕으로 한 제어와 전문 관리자의 지식을 기반으로 한 비선형 학습 모델에 의한 제어 등이 공존할 수 있다. 이러한 다양한 요소들을 복합적으로 연동시키기 위해선 기존의 시퀀스 기반 제어 방식에는 한계가 있을 수 있다. 관행의 방식과 같이 시계열 상에서 획득한 충분한 데이터를 이용하여 제어의 양과 시점을 결정하는 방식은 예외 상황에 충분히 대처하기 어려운 단점이 있을 수 있다. 이러한 예외 상황은 자연적인 조건의 변화에 따라 불가피하게 발생하는 경우와 시스템의 오류에 기인하는 경우로 나뉠 수 있다. 본 연구에서는 실시간으로 변하는 시설환경 내의 다양한 환경요소를 실시간으로 분석하고 상응하는 제어를 수행하여 수학적이며 예측 가능한 논리에 의해 준비된 제어시스템을 보완할 방법을 연구하였다. 과거의 고성능 컴퓨팅(HPC; High Performance Computing)은 다수의 컴퓨터를 고속 네트워크로 연동하여 집적적으로 연산능력을 향상시킨 기술로 비용과 규모의 측면에서 많은 투자를 필요로 하는 첨단 고급 기술이었다. 핸드폰과 모바일 장비의 발달로 인해 소형 마이크로프로세서가 발달하여 근래 2 Ghz의 클럭 속도에 이르는 어플리케이션 프로세서(AP: Application Processor)가 등장하기도 하였다. 상대적으로 낮은 성능에도 불구하고 저전력 소모와 플랫폼의 소형화를 장점으로 한 AP를 시설환경의 실시간 제어에 응용하기 위한 방안을 연구하였다. CPU의 클럭, 메모리의 양, 코어의 수량을 다음과 같이 달리한 3가지 시스템을 비교하여 AP를 이용한 마이크로 클러스터링 기술의 성능을 비교하였다.1) 1.5 Ghz, 8 Processors, 32 Cores, 1GByte/Processor, 32Bit Linux(ARMv71). 2) 2.0 Ghz, 4 Processors, 32 Cores, 2GByte/Processor, 32Bit Linux(ARMv71). 3) 1.5 Ghz, 8 Processors, 32 Cores, 2GByte/Processor, 64Bit Linux(Arch64). 병렬 컴퓨팅을 위한 개발 라이브러리로 MPICH(www.mpich.org)와 Open-MP(www.openmp.org)를 이용하였다. 2,500,000,000에 이르는 정수 중 소수를 구하는 연산에 소요된 시간은 1)17초, 2)13초, 3)3초 이었으며, $12800{\times}12800$ 크기의 행렬에 대한 2차원 FFT 연산 소요시간은 각각 1)10초, 2)8초, 3)2초 이었다. 3번 경우는 클럭속도가 3Gh에 이르는 상용 데스크탑의 연산 속도보다 빠르다고 평가할 수 있다. 라이브러리의 따른 결과는 근사적으로 동일하였다. 선행 연구에서 획득한 3차원 계측 데이터를 1초 단위로 3차원 선형 보간법을 수행한 경우 코어의 수를 4개 이하로 한 경우 근소한 차이로 동일한 결과를 보였으나, 코어의 수를 8개 이상으로 한 경우 앞선 결과와 유사한 경향을 보였다. 현장 보급 가능성, 구축비용 및 전력 소모 등을 종합적으로 고려한 AP 활용 마이크로 클러스터링 기술을 지속적으로 연구할 것이다.

  • PDF

계층적 분해 방법과 PCA를 이용한 공장규모 실시간 감시 및 진단 (Plant-wide On-line Monitoring and Diagnosis Based on Hierarchical Decomposition and Principal Component Analysis)

  • 조현우;한종훈
    • 한국가스학회지
    • /
    • 제1권1호
    • /
    • pp.27-32
    • /
    • 1997
  • 화학 공정을 계속적으로 감시함으로써 공정의 이상이 장치의 고장 또는 폭발에 이르지 않도록 조기에 이상을 감시하는 기술은 공장 조업의 안정성과 생산성의 측면에서 볼 때 매우 중요하다 최근, DCS와 같은 공정 정보 시스템이 널리 보급됨에 따라서 방대한 양의 데이터들을 해석해서 실시간으로 공정을 감시하고 진단할 수 있는 기반이 마련되었다. 본 연구에서는 계층적 분해 기법과 PCA에 기반을 둔 공장 규모의 실시간 감시 기법을 제안한다. 대형 공정을 효율적으로 모니터링 하기 위하여 전체 공정은 몇 개의 군으로 나뉘며 또한 이 군은 다시 몇 개의 하위 군으로 세분하게 된다. 이렇게 전체 공정을 분해하여 계층적인 공정 모델을 구성함으로써, 전체 공정의 조업 상황을 감시할 수 있을 뿐만 아니라 이상이 발생했을 시에는 하위 계층의 조업 상황을 고려하여 보다 자세한 이상 원인을 진단할 수 있다. 또한 각 세부 단위 공정들에 대한 조업 정보를 포함하고 있는 하위 모델들과 전체 조업 전반에 관한 정보를 지닌 전체 모델을 통하여 공정 이상을 조기에 감시함으로써 이상이 전파를 방지할 수 있다. 이러한 실시간 감시 및 진단 기법을 구현학 Idnl하여 기존의 SPC와 다변량 통계 기법의 하나인 PCA를 적용하였으며, 제안한 방법의 감시 및 진단 성능을 평가하기 위하여 41개의 측정 변수를 가진 Tennessee Eastman 공정에 대하여 전산 모사를 수행하였다. 세 가지 경우에 대하여 적용한 결과들은 이상의 신속한 감지와 믿을만한 원인 진단 능력을 보여 주었다.

  • PDF

VILODE : 키 프레임 영상과 시각 단어들을 이용한 실시간 시각 루프 결합 탐지기 (VILODE : A Real-Time Visual Loop Closure Detector Using Key Frames and Bag of Words)

  • 김혜숙;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권5호
    • /
    • pp.225-230
    • /
    • 2015
  • 본 논문에서는 키 프레임 영상과 SURF 특징점 기반의 시각 단어들을 이용한 효과적인 실시간 시각 루프 결합 탐지기 VILODE를 제안한다. 시각 루프 결합 탐지기는 과거에 지나온 위치들 중 하나를 다시 재방문하였는지를 판단하기 위해, 새로운 입력 영상을 이미 지나온 위치들에서 수집한 과거 영상들과 모두 비교해보아야 한다. 따라서 새로운 위치나 장소를 방문할수록 비교 대상 영상들이 계속해서 증가하기 때문에, 일반적으로 루프 결합 탐지기는 실시간 제약과 높은 탐지 정확도를 동시에 만족하기 어렵다. 이러한 문제점을 극복하기 위해, 본 시스템에서는 입력 영상들 중에서 의미 있는 것들만을 선택해 이들만을 비교하는 효과적인 키 프레임 선택 방법을 채택하였다. 따라서 루프 탐지에 필요한 영상 비교를 대폭 줄일 수 있다. 또한 본 시스템에서는 루프 결합 탐지의 정확도와 효율성을 높이기 위해, 키 프레임 영상들을 시각 단어들로 표현하고, DBoW 데이터베이스 시스템을 이용해 키 프레임 영상들에 대한 색인을 구성하였다. TUM 대학의 벤치마크 데이터들을 이용한 실험을 통해, 본 논문에서 제안한 시각 루프 결합 탐지기의 높은 성능을 확인할 수 있었다.

분산 클러스터 메모리 기반 대용량 OWL Horst Lite 온톨로지 추론 기법 (A Scalable OWL Horst Lite Ontology Reasoning Approach based on Distributed Cluster Memories)

  • 김제민;박영택
    • 정보과학회 논문지
    • /
    • 제42권3호
    • /
    • pp.307-319
    • /
    • 2015
  • 현재 대용량 온톨로지를 추론하기 위해 하둡 기반의 분산 클러스터 환경을 구축한 후, 맵-리듀스 알고리즘을 기반으로 추론을 수행하는 방식이 활발히 연구되고 있다. 그러나 본 논문에서는 분산 클러스터의 메모리 환경에서 대용량 OWL Horst Lite 온톨로지 추론을 위한 기법을 제안한다. 대용량 온톨로지 추론에 사용되는 규칙 기반 추론 방식은 데이터가 더 이상 추론 되지 않을 때까지 트리플 형식으로 표현된 온톨로지에 추론 규칙을 반복적으로 수행한다. 따라서 컴퓨터 디스크에 적재된 대용량의 온톨로지를 대상으로 추론을 수행하면 추론 시스템의 성능이 상당히 저하된다. 이러한 단점을 극복하기 위해서 본 논문에서는 메모리 기반의 분산 클러스터 프레임워크인 Spark를 기반으로 온톨로지를 메모리에 적재한 후, 추론을 수행하는 기법을 제안한다. Spark에 적합한 OWL Horst Lite 온톨로지 추론 시스템을 구현하기 위해서 대용량 온톨로지를 적절한 크기의 블록으로 분할한 후, 각각의 블록을 분산 클러스터를 구성하는 각 노드의 메모리에 분산 적재하여 작업을 수행하는 방법론을 제안하였다. 제안하는 기법의 효율성을 검증하기 위해, 온톨로지 추론과 검색 속도를 평가하는 공식 데이터인 LUBM을 대상으로 실험하였다. 대표적인 맵-리듀스 기반 온톨로지 추론 엔진인 WebPIE와 비교 실험한 결과, LUBM8000(11억개 트리플, 155GB)에 대해서 WebPIE의 추론 처리량이 19k/초보다 3.2배 개선된 62k/초의 성능 향상이 있었다.