• 제목/요약/키워드: Combination Approach

검색결과 1,348건 처리시간 0.03초

감성 분석을 위한 FinBERT 미세 조정: 데이터 세트와 하이퍼파라미터의 효과성 탐구 (FinBERT Fine-Tuning for Sentiment Analysis: Exploring the Effectiveness of Datasets and Hyperparameters)

  • 김재헌;정희도;장백철
    • 인터넷정보학회논문지
    • /
    • 제24권4호
    • /
    • pp.127-135
    • /
    • 2023
  • 본 논문에서는 금융 뉴스 데이터로 추가적인 사전 학습이 진행된 BERT 기반 모델인 FinBERT 모델을 사용하여 금융 영역에서 감성 분석 시 학습시킬 데이터와 그에 맞는 하이퍼파라미터를 찾는 방법을 소개한다. 우리의 목표는 다양한 데이터 세트를 활용하고 하이퍼파라미터를 미세 조정하여 정확한 감성 분석을 위해 FinBERT 모델을 가장 잘 활용하는 방법에 대한 포괄적인 가이드를 제공하는 것이다. 이 연구에서는 제안된 FinBERT 모델 미세 조정 접근법의 아키텍처와 워크플로우를 개괄적으로 설명하고, 감성 분석 태스크를 위한 다양한 데이터 세트와 하이퍼파라미터의 성능을 강조한다. 또한, 감성 라벨링 작업에 GPT-3를 사용함으로써 GPT-3가 적절한 라벨러 역할을 하는지에 대한 신뢰성을 검증한다. 결과적으로 미세 조정된 FinBERT 모델이 다양한 데이터 세트에서 우수한 성능을 발휘 한다는 것을 보여주었고, 각 데이터 세트에 대해 전반적으로 우수한 성능을 보이는 학습률 5e-5와 배치 크기 64의 최적의 조합을 찾았다. 또 일반 도메인의 뉴스보다 일반 도메인의 트위터 데이터 세트에서 성능이 크게 향상됨을 기반으로 금융 뉴스 데이터만으로만 추가적으로 학습시키는 FinBERT 모델에 대한 의구심을 제시한다. 이를 통해 FinBERT 모델에 대한 최적의 접근 방식을 결정하는 복잡한 프로세스를 간소화하고 금융 분야 감성 분석 모델을 위한 추가적인 학습 데이터 세트와 미세 조정 시 하이퍼파라미터 선정에 대한 가이드라인을 제시한다.

우리나라 연근해 불법어업의 유형별 발생원인과 어업질서 확립방안에 관한 연구 (A Study on Origin of Coastal-Offshore Illegal Fisheries and some Establishment Devices of Fishery Order in Korea)

  • 최종화;정도훈;차철표
    • 수산해양교육연구
    • /
    • 제14권2호
    • /
    • pp.191-212
    • /
    • 2002
  • The economic and social bad influences of the illegal fishery bring about the results of the fishery resources exhaustion, of the fishery disorder and of the obstruction to sound management for fishery. The typical illegal fishery conducted in the coastal and offshore area of Korea can be divided as follows; fishery conducted by legally unauthorized method, fishery without permission from the Government, and fishery conducted in contravention of the laws and regulations concerning the fishing vessel, fishing gear and fishing method etc. The major reasons of origination of the illegal fishery in the coastal and offshore area of Korea are; Firstly, almost of the fishermen are poorly equipped in economical scale, Secondly, it is very easy to approach the illegal fishery because the domiciliation condition of the fishing village is deteriorated. Thirdly, almost of the fishermen are lacking in lawabiding spirit. Fourthly, the insolvent and unstable fisheries management policy with the lukewarm enforcement of the fisheries laws and regulations by the Government. Fifthly, the small scale family supporting fisheries are widespreaded. Sixthly, to retrieved the economical difficulties the fishermen are easily led astray the illegal fishery. As a conclusion the authors made some suggestions to stamp out the illegal fishery by this study. For the first, temptation fishermen into lawabiding fishery through intensification of the penal regulations is required. Second, simplification of the fishery type through combination of resemble fishing methods is required. Third, actual improvement of the fundamental fishery permission regime is required. Fourth, Introduction of the self-regulating or co-management system for the fishery management is required.

GLVQ클러스터링을 위한 필기체 숫자의 효율적인 특징 추출 방법 (The Efficient Feature Extraction of Handwritten Numerals in GLVQ Clustering Network)

  • 전종원;민준영
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.995-1001
    • /
    • 1995
  • 패턴인식은 전처리, 특징추출, 식별의 과정을 거쳐 인식을 하게된다. 식별과정 에서 여러개의 패턴이 흩어져 있을 경우에 유사한 패턴끼리 클러스터링을 위하여 한 카테고리 내에서 패턴을 분할하게 된다. 클러스터링 방법에는 통계적인 방법으로 k-means 방법, ISODATA알고리즘등이 있으며〔1〕, 최근에는 신경망에 의한 클러스터링 방법으로 T, Kohonen의 LVQ(Learning Vector Quantization)가 주로 이용되었다〔6〕. Nikhil R, Pal. et al은 LVQ알고리즘을 보다 개선한 방법으로 GLVQ(Generalized LVQ, 1993)를 제안하였다〔4〕.본 논문은 GLVQ 알고니즘으로 패턴을 클러스터링 할 경우에 효율적인 특징추출 방법을 제안한다. 본 논문에서는 20명의 필기체 숫자 0에서 9까지 의 200개 패턴을 여러 가지 방법으로 특징 추출하여 GLVQ알고리즘으로 10개(0-9의 패턴) 의 클러스터로 구분하고, 해당 클러스터에서 오분류되는 패턴의 비율로서 그 효율성을 비교 하였다. 그 결과 투영조합 방법을 이용하였을 경우 98.5%의 분류율을 나타내었다.

  • PDF

텍스트 구성요소 판별 기법과 자질을 이용한 문서 요약 시스템의 개발 및 평가 (Development and Evaluation of a Document Summarization System using Features and a Text Component Identification Method)

  • 장동현;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.678-689
    • /
    • 2000
  • 논 본문은 문서의 주요 내용을 나타내는 문장을 추출함으로써 요약문을 작성하는 자동 요약 기법에 대해 기술하고 있다. 개발한 시스템은 문서 집합으로부터 추출한 어휘적, 통계적 정보를 고려하여 요약 문장을 작성하는 모델이다. 시스템은 크게 두 부분, 학습과정과 요약과정으로 구성이 된다. 학습 과정은 수동으로 작성한 요약문장으로부터 다양한 통계적인 정보를 추출하는 단계이며, 요약 과정은 학습 과정에서 추출한 정보를 이용하여 각 문장이 요약문장에 포함될 가능성을 계산하는 과정이다. 본 연구는 크게 세 가지 의의를 갖는다. 첫째, 개발된 시스템은 각 문장을 텍스트 구성 요소의 하나로 분류하는 텍스트 구성 요소 판별 모델을 사용한다. 이 과정을 통해 요약 문장에 포함될 가능성이 없는 문장을 미리 제거하는 효과를 얻게 된다. 둘째, 개발한 시스템이 영어 기반의 시스템을 발전시킨 것이지만, 각각의 자질을 독립적으로 요약에 적용시켰으며, Dempster-Shafer 규칙을 사용해서 다양한 자질의 확률 값을 혼합함으로써 문장이 요약문에 포함될 최종 확률을 계산하게 된다. 셋째, 기존의 시스템에서 사용하지 않은 새로운 자질 (feature)을 사용하였으며, 실험을 통하여 각각의 자질이 요약 시스템의 성능에 미치는 효과를 알아보았다.

  • PDF

GAP 군집화에 기반한 필기 한글 단어 분리 (Word Segmentation in Handwritten Korean Text Lines based on GAP Clustering)

  • 정선화;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.660-667
    • /
    • 2000
  • 본 논문에서는 필기 한글 문자열 영상에 대한 단어 분리 방법을 제안한다. 제안된 방법은 gap 의 크기 정보를 사용하여 단어를 분리하는데, 이때 gap은 문자열 영상을 수직방향으로 투영한 후 흰-런 (white-run)을 찾음으로써 구할 수 있다. 문자열 영상으로부터 얻어지는 gap들의 크기를 측정한 후, 각각의 gap을 단어와 단어사이에 존재하는 gap과 문자와 문자사이에 존재하는 gap 중 하나로 분류한다. 본 논문에서는 필기 영문 문자열의 단어 분리를 위해 제안된 기존의 세 가지 거리 척도를 채택하고 군집화에 기반한 세 가지 분류방법을 적용하여 한글 문자열의 단어 분리를 위한 최적의 조합을 선정하였다. 우편봉투 상에 작성된 주소열로부터 수작업으로 추출한 305 개의 문자열 영상을 사용하여 실험한 결과 BB(bounding box) 거리를 사용하여 순차적 군집 방법을 적용하는 경우 3 순위까지의 누적 단어 분리 성공률이 88.52% 로서 가장 우수한 성능을 보여 주었다. 또한 하나의 문자열 영상에 대한 단어 분리 속도는 약 0.05초이다.

  • PDF

가상 착의 시뮬레이션을 이용한 래글런 소매 패턴 변화에 따른 착의 시 정량적 분석 가능성 모색 (A Study on Based on the Possibility of Quantitative Analysis using Virtual Clothing Simulation according to Raglan Sleeve Pattern Types)

  • 이예진;이병철
    • 한국생활과학회지
    • /
    • 제21권2호
    • /
    • pp.299-314
    • /
    • 2012
  • The purpose of this study was to explore effects of pattern alteration using a virtual clothing simulation approach in combination with 3D analysis software. Three raglan sleeves of different patterns were worn by an avatar using virtual clothing simulation with silk and cotton as the test fabrics. It was observed that the silhouette and hemline shape were affected differently based on raglan sleeve pattern and fabric type. By examining clothing pressure distribution, the cotton fabric designs and pattern shapes provided for a variety of influences on armhole and bust regions as well as the back sleeve area. For representative locations, cross section circumstance, cross section area, and volume were measured by using 3D analysis and the resulting correlation between the 2D and 3D data were investigated. Among different fabrics, there was little difference between the 2D and 3D clothing surface area. However, when using 3D analysis, clothing volume was significantly affected by different fabrics and pattern types. By simultaneously adopting the virtual simulator and 3D analysis, quantitative assessment of virtual clothing simulation was successfully conducted. In light of the results of this study, the resulting methodology is expected to be used as a comprehensive evaluation tool for virtual clothing simulation wear testing.

취약계층 노인의 경로식당 급식 서비스 경험에 관한 질적 연구: 침묵의 밥 (A Qualitative Study on the Experiences of Congregate Meal Services from the Low-income Elderly)

  • 서선희;유은주;안지윤
    • 대한영양사협회학술지
    • /
    • 제19권3호
    • /
    • pp.298-308
    • /
    • 2013
  • The elderly population in Korea is rapidly growing. As the population ages, meals become a greater concern, as physical and psychological health problems are directly affected by dietary life, especially for the lower-income elderly. Although the government provides support through a free congregate meal service, there is a lack of systematic management of this meal service. This study investigates the experience of the elderly, especially the symbolic meaning and issues regarding the congregate meal service in their dietary life, to establish strategies for improving congregate meal services. Qualitative data was collected from ten elderly receivers of meal services through in-depth interviews and data was analyzed using Colaizzi's phenomenological research methods. Overall, 90 significant statements, 13 formulated meanings, and five theme clusters were deduced. The five theme clusters for the importance of meal services to the elderly included the followings: "a real meal", "enjoyment of living", "maintenance of regular life", "place for social life" and "meal of silence". We found that the elderly regarded the congregate free meal service not only as meals to appreciate but also as a form of social life. Furthermore, the elderly did not typically express any complaints regarding congregate meal services because they are free. The results showed that it might be difficult to evaluate the quality of meal services based on the opinions of the service receivers. This study suggests it is necessary to develop multilateral evaluation methods to reflect the needs of the elderly and to improve the congregate meal services at elderly welfare centers.

군집화된 구간 중도절단자료에 대한 치유율 모형의 적용 (Cure Rate Model with Clustered Interval Censored Data)

  • 김양진
    • 응용통계연구
    • /
    • 제27권1호
    • /
    • pp.21-30
    • /
    • 2014
  • 치유율 모형(cure rate model)은 위험 그룹의 단조 감소에 대한 가정이 부적절한 경우에 적용될 수 있다. 예를 들어, 생존 분석에서 위험 그룹은 시간이 경과함에 따라 점점 감소하여 무한대의 시간대에는 영으로 수렴하며 이는 곧 생존 함수가 영으로 수렴함을 의미한다. 하지만 이러한 가정이 적합하지 못한 자료가 의약학, 사회학, 경제학 등에서 종종 발생된다. 즉, 어느 시점에 이르러 더 이상의 생존함수는 감소하지 않고 평행선을 보여주는 경우에 로그 순위검정(log rank test)과 Cox's 비례위험모형(proportional hazard model)의 적용은 바람직하지 못한 결론을 가져오게 된다. 이러한 자료에 대해 치유율 모형(cure rate model)에서는 사건 발생 취약 그룹(susceptible group)과 비취약 그룹(insusceptible group)으로 나누어 취약그룹에 대해서만 일반적인 생존 분석 방법을 적용하는 혼합 모형(mixture model)을 적용해왔다 (Berkson과 Gage, 1952). 본 연구에서는 이러한 치유율 모형을 군집화 구간 중도 절단 자료(clustered interval censored data)에 적용해 보고자 한다. 최근에 Kim과 Jhun (2008)은 구간 중도 절단자료에 대해 치유율 모형을 적용하였으며 본 연구에서는 그들의 방법을 군집화 자료로 확장할 것이다. 실제 자료 분석의 예로 금연자료를 분석할 것이다.

유연복합재를 이용한 헬리콥터 꼬리날개 구동축의 최적 설계 (Optimum Design of a Helicopter Tailrotor Driveshaft Using Flexible Matrix Composite)

  • 신응수;홍을표;이기녕;김옥현
    • 대한기계학회논문집A
    • /
    • 제28권12호
    • /
    • pp.1914-1922
    • /
    • 2004
  • This paper provides a comprehensive study of optimum design of a helicopter tailrotor driveshaft made of the flexible matrix composites (FMCs). Since the driveshaft transmits power while subjected to large bending deformation due to aerodynamic loadings, the FMCs can be ideal for enhancing the drivetrain performance by absorbing the lateral deformation without shaft segmentation. However, the increased lateral flexibility and high internal damping of the FMCs may induce whirling instability at supercritical operating conditions. Thus, the purpose of optimization in this paper is to find a set of tailored FMC parameters that compromise between the lateral flexibility and the whirling stability while satisfying several criteria such as torsional buckling safety and the maximum shaft temperature at steadystate conditions. At first, the drivetrain was modeled based on the finite element method and the classical laminate theory with complex modulus approach. Then, an objective function was defined as a combination of an allowable bending deformation and external damping and a genetic algorithm was applied to search for an optimum set with respect to ply angles and stack sequences. Results show that an optimum laminate consists of two groups of layers: (i) one has ply angles well below 45$^{\circ}$ and the other far above 45$^{\circ}$ and (ii) the number of layers with low ply angles is much bigger than that with high ply angles. It is also found that a thick FMC shaft is desirable for both lateral flexibility and whirling stability. The genetic algorithm was effective in converging to several local optimums, whose laminates exhibit similar patterns as mentioned above.

A New Approach to Structure of Aerodynamic Fin Control System for STT Missiles

  • Song, Chan-Ho;Lee, Yong-In;Kim, Seung-Hwan;Kim, Pil-Seong
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.537-541
    • /
    • 2003
  • In order to control the missiles by aerodynamics, control surfaces sometime called fins are used. Deflection angles of these fins are the right control variables of the aerodynamics, but aerodynamicists prefer to use analytic variables called aileron, elevator and rudder instead of these physical variables, because these three analytic variables dominantly influence on the roll, pitch and yaw channels of the missile maneuver, respectively, and each can be assumed a linear combination of four fin deflection angles. On that basis, roll, pitch and yaw autopilots for controlling the attitudes or lateral acceleration of the missile are designed, and as a consequence outputs of each autopilot are aileron, elevator and rudder commands, respectively. In the existing fin control scheme for the typical tail-fin controlled cruciform missiles, firstly these outputs are distributed to four fin defection commands, and after that four fins are actuated by fin controllers so that their deflections follow the commands. This paper shows that performance of such control schemes can be degraded significantly when fin actuators have certain physical constraints such as slew rate, voltage or current limit, uncertainty of actuator dynamics, and so on, and propose a new control scheme which alleviates such problems. This scheme can be widely applied to various fin actuation systems. But in this paper, for convenience, tail-fin controlled cruciform missile is taken as an example, and it is shown that a proposed control scheme gives better performance than the existing one.

  • PDF