• 제목/요약/키워드: Splitting method

검색결과 750건 처리시간 0.028초

통계적 기계학습에서의 ADMM 알고리즘의 활용 (ADMM algorithms in statistics and machine learning)

  • 최호식;최현집;박상언
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1229-1244
    • /
    • 2017
  • 최근 여러 분야에서 데이터에 근거한 분석방법론에 대한 수요가 증대됨에 따라 이를 처리할 수 있는 최적화 방법이 발전되고 있다. 특히 통계학과 기계학습 분야의 문제들에서 요구되는 다양한 제약 조건은 볼록 최적화 (convex optimization) 방법으로 해결할 수 있다. 본 논문에서 리뷰하는 alternating direction method of multipliers (ADMM) 알고리즘은 선형 제약 조건을 효과적으로 처리할 수 있으며, 합의 방식을 통해 병렬연산을 수행할 수 있어서 범용적인 표준 최적화 툴로 자리매김 되고 있다. ADMM은 원래의 문제보다 최적화가 쉬운 부분문제로 분할하고 이를 취합함으로써 복잡한 원 문제를 해결하는 방식의 근사알고리즘이다. 부드럽지 않거나 복합적인 (composite) 목적 함수를 최적화할 때 유용하며, 쌍대이론과 proximal 작용소 이론을 토대로 체계적으로 알고리즘을 구성할 수 있기 때문에 통계 및 기계학습 분야에서 폭 넓게 활용되고 있다. 본 논문에서는 최근 통계와 관련된 여러 분야에서 ADMM알고리즘의 활용도를 살펴보고자 하며 주요한 두 가지 주제에 중점을 두고자 한다. (1) 목적식의 분할 전략과 증강 라그랑지안 방법 및 쌍대문제의 설명과 (2) proximal 작용소의 역할이다. 알고리즘이 적용된 사례로, 별점화 함수 추정 등의 조정화 (regularization)를 활용한 방법론들을 소개한다. 모의 자료를 활용하여 lasso 문제의 최적화에 대한 실증결과를 제시한다.

통계와 시각화를 결합한 데이터 분석: 예측모형 대한 시각화 검증 (Data analysis by Integrating statistics and visualization: Visual verification for the prediction model)

  • 문성민;이경원
    • 디자인융복합연구
    • /
    • 제15권6호
    • /
    • pp.195-214
    • /
    • 2016
  • 예측 분석은 패턴인식(Pattern recognition) 혹은 기계학습(Machine learning)으로 불리는 확률적 학습 알고리즘을 기반으로 하기 때문에 사용자가 분석 과정에 개입하여 더 많은 정보를 얻어내기 위해서는 높은 통계적 지식수준이 요구된다. 또한 사용자는 분석 결과외의 다른 정보를 확인 할 수 없고 데이터의 특성 변화와 데이터 하나하나의 특징을 파악하기 힘들다는 단점이 있다. 본 연구는 이러한 예측분석의 단점을 보완하고자 통계적인 데이터 분석 방법과 시각화 분석 방법을 결합하여 데이터 분석을 진행하였으며 통계적인 분석 방법만을 진행 할 경우 발생하는 단점을 보완하고 데이터에서 더 많은 정보를 도출해 내기 위한 방법론을 제시 하고자하였다. 이를 위해 본 연구는 영화 리뷰에서 추출한 감정 어휘가 독립변인이고 영화의 흥행 값이 종속변인인 데이터를 예제 데이터로 활용하여 진행하였다. 본 연구의 연구 방법론을 적용하였을 때의 이점은 다음과 같다. 첫째, 의사결정나무 분석에서 제시된 분할 기준이 적용될 때 마다 변하는 데이터의 패턴을 파악할 수 있다. 둘째, 제시된 최종 예측모형에 포함된 데이터들의 특성을 확인 할 수 있다. 본 연구의 시사점은 예측모형의 단점을 보완하고 데이터로부터 더 많은 정보를 추출하기 위해 통계적인 데이터 분석과 시각적인 데이터 분석을 결합하여 시행하였다는 것이다. 통계적인 분석 방법을 통해 각 변수의 관계를 파악하고 높은 예측 값을 가지는 모형을 도출하였으며, 시각화 분석에서는 인터랙션 기능을 제공함으로서 통계적으로 제시된 예측모형을 검증하고 더 다양한 정보를 도출 할 수 있게 하였다.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

Effects of Al2O3 Coating on BiVO4 and Mo-doped BiVO4 Film for Solar Water Oxidation

  • Arunachalam, Maheswari;Yun, Gun;Lee, Hyo Seok;Ahn, Kwang-Soon;Heo, Jaeyeong;Kang, Soon Hyung
    • Journal of Electrochemical Science and Technology
    • /
    • 제10권4호
    • /
    • pp.424-432
    • /
    • 2019
  • Planar BiVO4 and 3 wt% Mo-doped BiVO4 (abbreviated as Mo:BiVO4) film were prepared by the facile spin-coating method on fluorine doped SnO2(FTO) substrate in the same precursor solution including the Mo precursor in Mo:BiVO4 film. After annealing at a high temperature of 450℃ for 30 min to improve crystallinity, the films exhibited the monoclinic crystalline phase and nanoporous architecture. Both films showed no remarkably discrepancy in crystalline or morphological properties. To investigate the effect of surface passivation exploring the Al2O3 layer, the ultra-thin Al2O3 layer with a thickness of approximately 2 nm was deposited on BiVO4 film using the atomic layer deposition (ALD) method. No distinct morphological modification was observed for all prepared BiVO4 and Mo:BiVO4 films. Only slightly reduced nanopores were observed. Although both samples showed some reduction of light absorption in the visible wavelength after coating of Al2O3 layer, the Al2O3 coated BiVO4 (Al2O3/BiVO4) film exhibited enhanced photoelectrochemical performance in 0.5 M Na2SO4 solution (pH 6.5), having higher photocurrent density (0.91 mA/㎠ at 1.23 V vs. reversible hydrogen electrode (RHE), briefly abbreviated as VRHE) than BiVO4 film (0.12 mA/㎠ at 1.23 VRHE). Moreover, Al2O3 coating on the Mo:BiVO4 film exhibited more enhanced photocurrent density (1.5 mA/㎠ at 1.23 VRHE) than the Mo:BiVO4 film (0.86 mA/㎠ at 1.23 VRHE). To examine the reasons, capacitance measurement and Mott-Schottky analysis were conducted, revealing that the significant degradation of capacitance value was observed in both BiVO4 film and Al2O3/Mo:BiVO4 film, probably due to degraded capacitance by surface passivation. Furthermore, the flat-band potential (VFB) was negatively shifted to about 200 mV while the electronic conductivities were enhanced by Al2O3 coating in both samples, contributing to the advancement of PEC performance by ultra-thin Al2O3 layer.

P와 B 이온이 함유된 나노 티타니아 광촉매의 광 전기화학적 수소 제조 성능 (Photo-Electrochemical Hydrogen Production Over P- and B- Incorporated $TiO_2$ Nanometer Sized Photo-Catalysts)

  • 곽병섭;최희찬;우재욱;이주승;안준범;류시경;강미숙
    • 청정기술
    • /
    • 제17권1호
    • /
    • pp.78-82
    • /
    • 2011
  • 본 연구에서는 보다 효율적인 광 전기화학적 수소제조를 위하여 광촉매로써 티타니아 골격에 positive-type 반도체로써 B 이온, negative-type 반도체로써 P 이온을 삽입하여 고온 고압에서 용매열(solvothermal)법으로 P- 그리고 B-$TiO_2$ 나노 입자를 제조하였다. 제조한 P-$TiO_2$와 B-$TiO_2$의 물리적 특성은 X-ray 회절분석법, 투과전자현미경, 자외선-가시선 분광광도계, 발광분광계를 통해 확인하였다. 메탄올/물(1:1) 광분해 수소제조 실험 결과, 1.0 mol% B-$TiO_2$ 광촉매가 순수 anatase $TiO_2$ 광촉매 보다 활성이 향상되었으며, 0.5 g의 1.0 mol% B-$TiO_2$ 촉매를 사용한 경우 10시간 반응 시 0.42 mL의 수소가 발생되었다.

시그니처 트리를 사용한 의미적 유사성 검색 기법 (Semantic Similarity Search using the Signature Tree)

  • 김기성;임동혁;김철한;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.546-553
    • /
    • 2007
  • 온톨로지의 활용이 늘어나면서 의미적 유사성 검색에 대한 관심이 높아지고 있다. 본 논문에서는 질의 객체와의 의미적 유사성이 높은 객체를 검색하는 최근접 질의 기법을 제안하였다. 의미적 유사성을 측정하는 유사성 함수로는 최적 대응값 방식의 유사도 함수를 사용하였으며 주석 정보에 대한 색인을 위해 시그니처 트리를 사용하였다. 시그니처 트리는 집합 유사성 검색에서 많이 사용되는 색인 구조로서 유사성 검색에 사용하기 위해서는 검색시 각 노드를 탐색하였을 때 발견할 수 있는 유사도의 최대값을 예측할 수 있어야 한다. 이에 본 논문에서는 최적 대응값 방식의 유사도 함수에 대한 예측 최대값 함수를 제안하고 올바른 예측 함수임을 증명하였다. 또한 시그니처 트리에 동일한 시그니처가 중복되어 저장되지 않도록 구조를 개선하였다. 이는 시그니처 트리의 크기를 감소시킬 뿐만 아니라 질의 성능 또한 향상시켜 주었다. 실험의 데이타로는 대용량 온톨로지와 주석 정보 데이타를 제공하는 Gene Ontology(GO)를 사용하였다. 실험에서는 제안한 방법의 성능 향상 외에도 페이지 크기와 노드 분할 방법이 의미적 유사성 질의 성능에 미치는 영향에 대해 알아보았다.

대규모 육지수문모형에서 사용 가능한 지표면 및 지표하 연계 물흐름 모형의 개발: II. 모형적용 (Development of a Conjunctive Surface-Subsurface Flow Model for Use in Land Surface Models at a Large Scale: Part II. Model Implementation)

  • 최현일
    • 한국방재학회 논문집
    • /
    • 제8권3호
    • /
    • pp.23-27
    • /
    • 2008
  • 대규모 육지수문모형(Land Surface Model, LSM)에서 종합적인 육지 물흐름 및 에너지흐름의 예측을 위해 새로운 지표면-지표하 연계 물흐름 모형이 지표하 물흐름 모의를 위한 3차원 체적평균 토양수분 이송방정식(Volume Averaged Soil-moisture Transpor, VAST)을 지표수 흐름모의를 위한 1차원 확산방정식과 연계하여 개발되었다. 각 흐름특성에 맞는 복합적인 수치해석법이 적용되어, 시간분할 방법에 의해 3차원 VAST 방정식의 종방향 흐름이 완전음해법에 의해 해석된 후, 횡방향 흐름이 양해법으로 구해지며, 그 후에 1차원 확산방정식은 MacCormack 유한차분법으로 계산한다. 이 새로운 흐름연계모형은 최신의 육지수문모형인 CLM(Common Land Model)내의 기존 1차원 수리수문계산부분을 대체하게 된다. CLM과 결합된 새로운 연계흐름모형은 오하이오 계곡부근의 시험유역에 적용되었으며, 모의결과는 지표면-지표하 물흐름 상호작용의 모의와 지표수 흐름추적방법을 사용한 새로운 모형의 유출예측이 실측치에 더 근접함을 보여준다. 이 개선된 육지수문모형은 지역적, 대륙적, 그리고 지구전체를 다루는 수문기상연구와 기후변화로 인한 재해예방을 위하여 기상모형인 CWRF(Climate extension of the next-generation Weather Research and Forecasting)와 연계될 예정이다.

무선 통신상 임의 에러에 대한 에러내성 엔트로피 부호화에 기반한 정지영상의 화질 개선 (An Improvement of Still Image Quality Based on Error Resilient Entropy Coding for Random Error over Wireless Communications)

  • 김정식;이근영
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.9-16
    • /
    • 2006
  • 많은 영상과 비디오 압축 알고리듬들은 영상을 블록으로 나누어 처리하여 각 블록에서 가변길이 부호비트를 생성한다. 만일 에러 검출기법을 사용하지 않고 가변길이 부호데이터를 에러 발생채널에 전송한다면 수신측 복호화기는 압축된 스트림(Stream)을 적절히 복호할 수 없다. 따라서 표준 영상 및 비디오 압축 알고리듬에서는 채널 에러로부터 데이터 스트림을 보호하기 위해 추가적인 정보들을 삽입한다. 그런 추가 정보 중의 하나가 재동기 마커(resynchronization marker)이다. 이 방법은 전송 에러 발생시 복호화를 다시 시작하기 위한 위치를 복호화기에게 알려줄 수 있지만 주파수 대역폭의 낭비가 심한 단점이 있다. 에러 내성 엔트로피 부호화(EREC)는 어떤 추가 정보 없이 재동기 시작점을 찾을 수 있는 방법으로 잘 알려져 있다. 이 방법은 대부분의 영상 압축 기법에서 사용되는 접두 코드(prefix code)에 적용될 수 있으므로 본 논문에서는 FEREC(Fast Error-Resilient Entropy Coding)의 성능을 개선한 EREREC(Efficient and Robust EREC) 기법을 제안하였다. 첫째로 연속 블록들의 부호화비트 길이를 이용하여 초기 탐색 위치를 계산한다. 둘째, 초기 오프셋은 가변 길이 부호들에서 길고 짧은 블록들의 확률 분포를 이용하여 결정되고, 결정된 초기 오프셋 값은 제안 방법에서 사용되는 모든 오프셋 시퀀스 값들을 보장하기 위해 조정된다. 제안된 EREREC 알고리듬은 슬롯 구성에 있어 EREC보다 빠르며, 전송 에러 발생시 복호화된 영상의 화질이 개선된다. 실험 결과는, 임의 에러 발생 채널에서 기존의 EREC 및 FEREC와 복원영상의 화질을 비교하였을 때 약 $0.3{\sim}3.5dB$의 화질이 개선됨을 보여준다.

Mössbauer 분광법에 의한 Al0.2CoFe1.8O4분말의 자기적 특성 연구 (Mössbauer Study of Al0.2CoFe1.8O4 Ferrite Powders)

  • 채광표;이재광;권혁수;이영배
    • 한국자기학회지
    • /
    • 제13권6호
    • /
    • pp.231-236
    • /
    • 2003
  • Co-페라이트 CoF $e_2$ $O_4$에서 Fe 이온의 소량을 Al 이온으로 치환시킨 시료인 $A_{10.2}$ CoF $e_{1.8}$ $O_4$을 sol-gel 방법으로 제조하여 열처리 온도에 따른 결정학적 및 자기적 특성의 변화를 밝히기 위하여 x-선 회절기, FE-SEM, Mossbauer 분광기, 진동자력계 등을 이용한 측정을 하였다. 결정 구조는 spinel임을 알 수 있었으며, 격자 상수 값은 열처리 온도가 증가함에 따라 837 K 때 8.425 $\AA$에서 1073 K 때 8.321 $\AA$으로 감소하였다. 입자크기는 열처리 온도가 증가함에 따라 673 K 때 약 39 nm에서 1073 K 때 약 108 nm로 크게 증가하였다. 873 K 이상에서 열처리한 시료의 Mossbauer spectrum은 상온에서 F $e^{3+}$ 가 A와 B자리에 위치하여 나타나는 한 세트의 육중선이 중첩된 모양이었는데, 열처리 온도 증가에 따라 A자리의 초미세 자기장 값은 서서히 증가하였으나 B자리의 값은 빠르게 증가하였다. 이성질체 이동값과 사중극자 분열값은 거의 일정하였다. 포화자화는 473 K 때 0.7 emu/g 1073 K 때 72.1 emu/g로 선형적으로 급격히 증가하고, 보자력은 673 K 때 0.951 tOe에서 1073 K 때 0.374 tOe로 급격히 감소하였다.

한정된 메모리 공간에서 데이터 스트림의 빈발항목 최적화 방법 (Finding Frequent Itemsets Over Data Streams in Confined Memory Space)

  • 김민정;신세정;이원석
    • 정보처리학회논문지D
    • /
    • 제15D권6호
    • /
    • pp.741-754
    • /
    • 2008
  • 지속적으로 확장되는 데이터 스트림에 대한 데이터 마이닝 수행과정에서는 메모리 사용량을 가용한 범위 내로 제한하는 것이 중요한 요소이다. 본 논문에서는 데이터 스트림 환경에서 한정된 메모리 공간을 이용하여 빈발 항목집합을 탐색하는데 효과적인 프라임 패턴 트리(Prime pattern tree: PPT)구조를 제안한다. 프라임 패턴 트리는 기존의 전위 트리 구조와 비교하여 항목집합들을 하나의 노드로 관리함으로써 트리의 크기를 크게 줄일 수 있는 장점이 있다. 또한, 전지 임계값 $S_{\delta}$에 따라 노드를 병합하거나 분리하여 동적으로 트리의 크기와 결과 집합의 정확도를 마이닝 수행 중에 조절 할 수 있다. $S_{\delta}$값이 크면 한 노드에서 관리되는 항목집합의 수가 증가하게 되고, 출현 빈도수를 추정해야 하기 때문에, $S_{\delta}$값이 작을수록 결과집합의 정확도가 높다. 이처럼 PPT에는 트리의 크기와 정확도의 trade-off 가 존재한다. PPT의 이러한 특성에 기반하여, 데이터 스트림에서 갑자기 데이터 집합에 변화가 생겨 빈발항목이 될 가능성이 높은 항목들이 많이 출현하는 경우에도 마이닝을 지속적으로 수행할 수 있도록 지원한다. 본 논문에서는 프라임 패턴 트리를 이전 연구에서 제안한 데이터 스트림에서 최근 빈발 항목 탐색 방법인 estDec 방법에 적용하여 한정된 작은 양의 메모리 공간을 이용하여 온라인 데이터 스트림에서 빈발항목을 탐색하는 방법을 제시한다. 또한, 가용 메모리 범위에서 최적의 메모리를 사용하여 최적의 마이닝 결과를 얻을 수 있도록 하는 메모리 사용량에 대한 적응적 방법을 제시한다. 끝으로, 여러 실험을 통한 효율성 검증을 통해 제안된 방법의 여러 특성을 확인한다.