• 제목/요약/키워드: 데이터 분석론

검색결과 1,385건 처리시간 0.028초

FMM 신경망에서 가중치 요소와 하이퍼박스 중첩효과 분석 (Analysis of Weight Factor and Hyperbox Overlapping Effects in FMM Neural Networks)

  • 박현정;김호준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.691-693
    • /
    • 2005
  • 본 연구에서는 FMM 신경망의 학습 알고리즘에서 하이퍼박스 확장과정에 수반되는 중첩현상을 분석하고, 이에 대한 축소 과정의 특성과 이를 보완하기 위한 새로운 활성화 함수에 관하여 고찰한다. 하이퍼박스 중첩 영역에 속하는 패턴 데이터는 그 분류 결과가 왜곡될 수 있다. 왜냐하면 학습과정에서 하이퍼박스상의 특징범위는 특징값의 빈도요소를 고려하지 않음으로 인하여 극소수의 비정상적 데이터에 관해서도 동일 수준으로 민감하게 확장되기 때문이다. 본 논문에서는 특징집합에서 가중치와 빈도요소를 반영하는 모델로서 이러한 중첩현상의 영향을 개선하는 방법론을 소개한다. 제안된 이론은 단순화된 패턴집합에 대하여 그 유용성을 이론적으로 고찰하며, 실제 패턴분류 문제에 적용하여 실험적으로 평가한다.

  • PDF

언어학 관점에서의 한국어 대조학습 기반 문장 임베딩의 허위 문맥화에 대한 고찰 (Analyzing Spurious Contextualization of Korean Contrastive Sentence Representation from the Perspective of Linguistics)

  • 정유현;한명수;채동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.468-473
    • /
    • 2023
  • 본 논문은 사전 학습 언어 모델의 특성인 이방성과 문맥화에 주목하여 이에 대한 분석 실험과 한국어 언어 모델만의 새로운 관점을 제안한다. 최근 진행된 영어 언어 모델 분석 연구에서 영감을 받아, 한국어 언어 모델에서도 대조학습을 통한 이방성과 문맥화의 변화를 보고하였으며, 다양한 모델에 대하여 토큰들을 문맥화 정도에 따라 분류하였다. 또한, 한국어의 언어학적 특성을 고려하여, 허위 문맥화를 완화할 수 있는 토큰을 문맥 중심어로, 문맥 중심어의 임베딩을 모방하는 토큰을 문맥 기능어로 분류하는 기준을 제안하였다. 간단한 적대적 데이터 증강 실험을 통하여 제안하는 분류 기준의 가능성을 확인하였으며, 본 논문이 향후 평가 벤치마크 및 데이터셋 제작, 나아가 한국어를 위한 강건한 학습 방법론에 기여하길 바란다.

  • PDF

SP 순위 자료별 오차를 고려하는 순위로짓 모형 추정에 관한 연구 (Development of Scaled Explosion Logit Model Considering Reliability of Ranking Data)

  • 김강수;조혜진
    • 대한교통학회지
    • /
    • 제22권6호
    • /
    • pp.197-206
    • /
    • 2004
  • SP 순위자료는 모든 선택 가능한 대안을 일괄적으로 제시하고 응답자에게 대안을 선호 순서대로 평가하게 하는 방법으로, 표현되는 순위는 선택대안 효용의 크기 순서를 의미한다. 그러나 순위자료는 선택대안이 많은 경우 응답자가 제시하는 순위가 낮을수록, 혹은 하위 순위부터 응답자가 적는 경우는 고려하는 경우 순위가 높을수록 순위자료의 신뢰성은 떨어진다. 본 논문의 목적은 SP 순위자료를 이용하여 SP 순위모형을 추정하는 방법론에 대해서 살표보고 각 순위별 자료가 갖고 있는 신뢰성을 분석하고 이를 극복하는 방법론을 제시하는데 있다. 이를 위해 화물운송수단 SP 순위자료를 활용하여 기존 순위확장(exploded logit) 모형이 내재하는 가정, 즉 각 순위별 자료의 오차는 동일하고 독립적인 선택자료로 변환할 수 있다는 가정을 검증하고 순위가 내려갈수록, 혹은 올라갈수록 각 순위자료가 갖는 오차의 정도를 반영하여 이를 극복할 수 있는 방법론을 제시한다. 또한, 순위자료를 단순 선택자료로 확장시키는 경우 몇순위까지 확장시키는 것이 타당한가를 실증적으로 제시한다. 분석결과, SP 순위자료에서는 순위가 낮아지면서 상이한 오차 및 의사결정 행태가 존재해 순위자료를 독립적인 선택자료로 단순 확장하여 순위로짓보형으로 단순 추정하면 편의가 발생할 수 있음을 보여주었다. 또한 본 연구의 사례 분석 결과 2순위까지만 단순 독립적인 선택 자료로 확장이 가능하며, 2순위를 초과하면서 선호자료를 독립적인 선택자료로 단순 확장하는 것은 순위자료를 추정하는 데 있어 편의를 발생시키는 것으로 나타났다. 본 연구의 결과는 특정 사례에 대해서 분석된 결과이지만 적용된 방법론은 일반적인 방법론으로써 SP 순위자료의 신뢰성을 제고시키는 분석 방법론에 대한 일조할 것으로 기대한다.

기술 키워드 네트워크와 인지지도 분석을 통한 무인항공기 비행체산업의 유망기술 도출 연구 (Technology Keyword Network and Cognitive Map Analysis: to prospect promising technology of UAV(Unmanned Aerial Vehicle) airframe industry)

  • 주성현;하성호;박상현
    • 한국산업정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.55-72
    • /
    • 2016
  • 본 연구는 국내 무인항공기산업과 같은 신성장동력산업의 국제적 기술 경쟁력 확보와 시장성 확보 및 산업성장이 가능한 미래유망 기술을 도출하는 방법론을 제시하는 것이다. 이에 본 연구는 KrKwic, Excel, NetMiner등의 분석 툴을 활용하여 무인항공기산업 분야의 특허데이터를 대상으로 동시출현 단어를 활용한 소셜네트워크분석과 하위그룹분석, 인지지도분석 방법을 제시하였다. 그 결과, '비행조정 기술', '피아식별 기술' 등은 향후 유망한 기술로 선정하여 집중 투자할 필요성이 큰 기술이라 볼 수 있었다.

ALA인가 문헌정보학 학위 과정의 데이터 사서 양성과 관련된 교과목의 강의계획서 분석 (An Examination of the Course Syllabi Related to Data Librarian in the ALA-accredited Library and Information Science Degree Programs)

  • 박형주
    • 한국도서관정보학회지
    • /
    • 제54권4호
    • /
    • pp.307-334
    • /
    • 2023
  • 본 연구의 목적은 2023년 미국도서관협회(American Library Association, ALA)인가 문헌정보학 학위과정에서 제공하는 데이터 사서와 관련된 교과목의 강의계획서의 내용을 분석하는 것이다. 2023년 ALA인가 문헌정보학과에서 공개한 강의계획서 184개를 수집하였다. 데이터 사서의 주요 역량인 데이터 관리와 큐레이션, 데이터 분석 및 시각화, 메타데이터, 정보 서비스, 도서관 경영, 연구 방법론, 학술 도서관, 컴퓨터 프로그래밍, 데이터베이스 과목 등을 식별하였다. 이에 기반하여 데이터 사서와 관련된 강의계획서 127개를 식별한 후, 강의계획서의 내용을 집중 분석하였다. 구체적으로 교과목 명, 교과목 목표, 교과목 설명, 교육 내용, 과제(assignments)를 집중 분석하였다. 데이터 사서 양성을 위한 국내외 교과목의 비교를 위하여 국외 61개 문헌정보학과에서 개설한 교과목 명 3,045개, 교과목 설명 2,559개와 국내 37개 문헌정보학과에서 개설한 1,330개의 교과목 명을 수집 및 분석하였다. 국내외 문헌정보학과 모두 데이터 사서 양성을 위한 교과목을 골고루 개설하였음을 확인하였다. 본 연구의 결과는 향후 문헌정보학과에서 데이터 사서 양성을 위한 교육 과정의 개발 및 개정 시 논의의 시작점이 될 수 있는 기초 자료로 활용되기를 기대한다.

모바일 환경 응용을 위한 코너 특징점 기반의 회전 객체 검출 (Rotated object recognition based on corner feature points in mobile environment)

  • 김대환;박금춘;김신덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.23-26
    • /
    • 2013
  • 최근 모바일 장치의 영상 데이터 처리 능력 확대와 더불어 사용자가 요구하는 다양한 영상 데이터의 효율적인 인식 기술 연구가 요구되어지고 있다. 모바일 환경은 고성능 PC 환경과 달리 저사양의 CPU와 메모리를 탑재하고 있어, 영상에서 원하는 객체를 인식하기 위한 기존의 방법론으로는 사용자 요구를 실시간으로 충족하기 어려운 부분이 존재한다. 이에 모바일 환경에 맞는 객체 인식 방법론의 개발이 요구된다. 모바일 환경에서 실시간으로 객체 인식을 하기 위하여, 본 논문에서는 객체 코너 정보를 이용한 Harris corner detector[1]로부터 객체의 특징점을 추출하고, 이를 바탕으로 하여 영상내의 객체 정보 인식 방법을 제안한다. 제안하는 방법에 의해, 입력 영상에서 객체의 코너 정보를 빠르게 추출, 기존 특징점과의 비교를 통하여 영상 내부의 객체 인식을 진행한다. 일반적으로, 회전된 특징점 객체의 정보는 객체의 회전 정도에 따라 코너 픽셀 색상 정보의 변화가 발생하게 된다. 특징점의 색상값은 객체의 회전 정도에 영향을 받아 주변의 픽셀값과 혼합되는 특성이 존재한다. 본 논문에서는 회전 변경된 픽셀 색상값의 영향을 분석하여, 회전된 객체의 특징점 추출 및 객체 검출에 반영하도록 하여, 영상 내부의 회전된 객체 검출의 수행에 효과적으로 이용될 수 있도록 한다. 특징점의 코너 정보를 이용하여 객체를 인식하는 것은, 객체의 인식률은 다소 감소하더라도 모바일 환경에서 계산량의 감소를 통한 실시간 활용이 가능하도록 한다. 이러한 특성은 저성능 CPU와 메모리에서도 회전된 객체의 인식을 수행할 수 있게 하는데 상당히 효과적이다.

  • PDF

Key Card Arranging 기법을 활용한 핸드폰 기기의 Key Mapping 가이드라인에 대한 연구 (A Study on the Guidelines of Key Mapping for Mobile Devices using the Method of Key Card Arranging)

  • 최진호;강한종;이근민;이경진;김정하
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.275-280
    • /
    • 2006
  • 1990년대 휴대폰이 일반화가 시작된 이후 지금까지 수많은 종류의 휴대폰이 출시되어왔다. 종류가 다양해진 만큼 기능, 목적, 사용방법 또한 다변화 되었고, 이로 인해 매일같이 쏟아져 나오는 휴대폰의 기능 및 사용방법에 대해 유저들은 항상 새로운 방식을 익히도록 강요되고 있다. 이에 본 연구에서는 Key Card Arranging 기법을 활용하여 현재 모바일 기기 사용자들의 멘탈 모델에 적합한 최적의 Key Mapping에 대한 가이드라인을 제시함으로써 최소한의 노력으로 사용자들이 정보기기를 활용할 수 있도록 하는데 그 목적이 있다. 본 연구를 위하여 국내의 대표적인 6개 휴대폰 회사별로 선별된 테스트 서브젝트들을 선정하여 실험을 실시 하였으며, 구체적인 방법론은 다음과 같다. 우선 핸드폰 기기 내의 Hot Key에 대한 Key Mapping을 중심으로 Key Card Arranging 기법과 In-depth Interview 방법론을 활용하여 선정된 서브젝트들을 대상으로 사용자 멘탈 모델에 대한 데이터를 취합하였다. 취합된 자료를 중심으로 정량적 데이터 분석 방법을 활용, 사용자의 휴대폰 키 맵핑에 대한 이상적인 멘탈 모델을 제안하고, 최종적으로 본 연구를 통하여 사용자에게 최적의 경험을 제공하기 위하여 휴대폰 Key Mapping에 대한 가이드라인들을 제시한다.

  • PDF

보행행태조사방법론의 변화와 모바일 빅데이터의 가능성 진단 연구 - 보행환경 분석연구 최근 사례를 중심으로 - (Changes in Measuring Methods of Walking Behavior and the Potentials of Mobile Big Data in Recent Walkability Researches)

  • 김현주;박소현;이선재
    • 대한건축학회논문집:계획계
    • /
    • 제35권1호
    • /
    • pp.19-28
    • /
    • 2019
  • The purpose of this study is to evaluate the walking behavior analysis methodology used in the previous studies, paying attention to the demand for empirical data collecting for urban and neighborhood planning. The preceding researches are divided into (1)Recording, (2) Surveys, (3)Statistical data, (4)Global positioning system (GPS) devices, and (5)Mobile Big Data analysis. Next, we analyze the precedent research and identify the changes of the walkability research. (1)being required empirical data on the actual walking and moving patterns of people, (2)beginning to be measured micro-walking behaviors such as actual route, walking facilities, detour, walking area. In addition, according to the trend of research, it is analyzed that the use of GPS device and the mobile big data are newly emerged. Finally, we analyze pedestrian data based on mobile big data in terms of 'application' and distinguishing it from existing survey methodology. We present the possibility of mobile big data. (1)Improvement of human, temporal and spatial constraints of data collection, (2)Improvement of inaccuracy of collected data, (3)Improvement of subjective intervention in data collection and preprocessing, (4)Expandability of walking environment research.

한반도의 과거 기후 데이터 구축을 위한 누락된 기록 추정 (Estimation of Missing Records in Daily Climate Data over the Korean Peninsula)

  • 노규호;안국현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.135-135
    • /
    • 2020
  • 우리나라의 기후 자료는 일반적으로 기상청에서 발표하는 종관기상관측(ASOS)과 방재기상관측(AWS), 그리고 북한이 세계기상기구(WMO, World Meteorogical Organization)의 기상통신망(GTS)을 통해 보낸 북한기상관측(NKO)을 사용 할 수 있다. 그러나 이 중 40년 이상의 완전한 관측 자료를 얻을 수 있는 건 ASOS가 유일하지만 공간적인 표현에 한계를 갖고 있다. AWS는 관측소가 많다는 장점이 있지만 관측 기간이 길지 않고 이용 가능한 기간에도 관측이 연속적이지 못한 경우가 많다. NKO는 비록 27개의 관측소가 있지만 많은 데이터가 누락되어 일별 기후자료의 사용에 한계를 갖고 있다. 이러한 미관측 기간이나 관측 자료의 누락은 연속적인 시계열 자료분석을 기반으로 하는 수자원 모델링에 있어서 문제를 야기한다. 본 연구는 1973년부터 2019년까지 47년의 신뢰도 높은 한반도 일일 기후 자료를 구축하기 위해 다양한 방법론을 비교하였다. 추정에 사용한 방법은 총 7개로 EM algorithm for probabilistic principal components (PPCA-EM), Inverse distance weight method (IDWM), Nearest neighbor method (NNM), Multivariate normal copulas (Copula), Elastic net model (Elastic), Ordinary kriging (OK), Regularized principal components with EM algorithm (RPCA-EM)를 살펴보았다. 다양한 형태의 결측치를 가정하여 그 결과값을 비교하였고 이는 Root mean squared error(RMSE), Kling-Gupta efficiency(KGE), Nash-Sutcliffe efficiency(NSE)를 통해 평가하였다. 최종 선택된 방법론을 통하여 한반도 전역을 그리드 기반의 강수 및 최저온도/최고온도의 일별자료로 생성하였다.

  • PDF

유전자알고리즘을 이용한 웨이블릿분석 및 인공신경망기법의 통합모형구축 (A Hybrid System of Wavelet Transformations and Neural Networks Using Genetic Algorithms: Applying to Chaotic Financial Markets)

  • Shin, Taeksoo;Han, Ingoo
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.271-280
    • /
    • 1999
  • 인공신경망을 시계열예측에 적용하는 경우에 고려되어야 할 문제중, 특히 모형에 적합한 입력변수의 생성이 중요시되고 있는데, 이러한 분야는 인공신경망의 모형생성과정에서 입력변수에 대한 전처리기법으로써 다양하게 제시되어 왔다. 가장 최근의 입력변수 전처리기법으로써 제시되고 있는 신호처리기법은 전통적 주기분할처리방법인 푸리에변환기법(Fourier transforms)을 비롯하여 이를 확장시킨 개념인 웨이블릿변환기법(wavelet transforms) 등으로 대별될 수 있다. 이는 기본적으로 시계열이 다수의 주기(cycle)들로 구성된 상이한 시계열들의 집합이라는 가정에서 출발하고 있다. 전통적으로 이러한 시계열은 전기 또는 전자공학에서 주파수영역분할, 즉 고주파 및 저주파수를 분할하기 위한 기법에 적용되어 왔다. 그러나, 최근에는 이러한 연구가 다양한 분야에 활발하게 응용되기 시작하였으며, 그 중의 대표적인 예가 바로 경영분야의 재무시계열에 대한 분석이다 전통적으로 재무시계열은 장, 단기의사결정을 가진 시장참여자들간의 거래특성이 시계열에 각기 달리 가격으로 반영되기 때문에 이러한 상이한 집단들의 고유한 거래움직임으로 말미암아 예를 들어, 주식시장이 프랙탈구조를 가지고 있다고 보기도 한다. 이처럼 재무시계열은 다양한 사회현상의 집합체라고 볼 수 있으며, 그만큼 예측모형을 구축하는데 어려움이 따른다. 본 연구는 이러한 시계열의 주기적 특성에 기반을 둔 신호처리분석으로서 기존의 시계열로부터 노이즈를 줄여 주면서 보다 의미 있는 정보로 변환시켜 줄 수 있는 웨이블릿분석 방법론을 새로운 필터링기법으로 사용하여 현재 많은 연구가 진행되고 있는 인공신경망과의 모형결합을 통해 기존연구와는 다른 새로운 통합예측방법론을 제시하고자 한다. 본 연구에서 제시하는 통합방법론은 크게 2단계 과정을 거쳐 예측모형으로 완성이 된다. 즉, 1차 모형단계에서 원시 재무시계열은 먼저 웨이블릿분석을 통해서 노이즈가 필터링 되는 동시에, 과거 재무시계열의 프랙탈 구조, 즉 비선형적인 움직임을 보다 잘 반영시켜 주는 다차원 주기요소를 가지는 시계열로 분해, 생성되며, 이렇게 주기에 따라 장단기로 분할된 시계열들은 2차 모형단계에서 신경망의 새로운 입력변수로서 사용되어 최종적인 인공 신경망모델을 구축하는 데 반영된다.

  • PDF