• Title/Summary/Keyword: time complexity analysis

검색결과 702건 처리시간 0.026초

텍스트 데이터 시각화를 위한 MVC 프레임워크 (A MVC Framework for Visualizing Text Data)

  • 최광선;정교성;김수동
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.39-58
    • /
    • 2014
  • 빅데이터의 중요성에 대한 인식이 확산되고, 관련한 기술이 발전됨에 따라, 최근에는 빅데이터의 처리와 분석의 결과를 어떻게 시각화할 것인지가 매우 관심 받는 주제로 부각되고 있다. 이는 분석된 결과를 보다 명확하고 효과적으로 전달하는 데에 있어서 데이터의 시각화가 매우 효과적인 방법이기 때문이다. 시각화는 분석 시스템과 사용자가 소통하기 위한 하나의 그래픽 사용자 인터페이스(GUI)를 담당하는 역할을 한다. 통상적으로 이러한 GUI 부분은 데이터의 처리나 분석의 결과와 독립될 수록 시스템의 개발과 유지보수가 용이하며, MVC(Model-View-Controller)와 같은 디자인 패턴의 적용을 통해 GUI와 데이터 처리 및 관리 부분 간의 결합도를 최소화하는 것이 중요하다. 한편 빅데이터는 크게 정형 데이터와 비정형 데이터로 구분할 수 있는데 정형 데이터는 시각화가 상대적으로 용이한 반면, 비정형 데이터는 시각화를 구현하기가 복잡하고 다양하다. 그럼에도 불구하고 비정형 데이터에 대한 분석과 활용이 점점 더 확산됨에 따라, 기존의 전통적인 정형 데이터를 위한 시각화 도구들의 한계를 벗어나기 위해 각각의 시스템들의 목적에 따라 고유의 방식으로 시각화 시스템이 구축되는 현실에 직면해 있다. 더욱이나 현재 비정형 데이터 분석의 대상 중 대부분을 차지하고 있는 텍스트 데이터의 경우 언어 분석, 텍스트 마이닝, 소셜 네트워크 분석 등 적용 기술이 매우 다양하여 하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 용이하지 않다. 이는 현재의 텍스트 분석 결과에 대한 정보 모델이 서로 다른 시스템에 적용될 수 있도록 설계되지 못하는 경우가 많기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위하여 다양한 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.

쇼핑 웹사이트 탐색 유형과 방문 패턴 분석 (Analysis of shopping website visit types and shopping pattern)

  • 최경빈;남기환
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.85-107
    • /
    • 2019
  • 온라인 소비자는 쇼핑 웹사이트에서 특정 제품군이나 브랜드에 속한 제품들을 둘러보고 구매를 진행할 수 있고, 혹은 단순히 넓은 범위의 탐색 반경을 보이며 여러 페이지들을 돌아보다 구매를 진행하지 않고 이탈할 수 있다. 이러한 온라인 소비자의 행동과 구매에 관련된 연구는 꾸준히 진행되어왔으며, 실무에서도 소비자들의 행동 데이터를 바탕으로 한 서비스 및 어플리케이션이 개발되고 있다. 최근에는 빅데이터 기술의 발달로 소비자 개인 단위의 맞춤화 전략 및 추천 시스템이 활용되고 있으며 사용자의 쇼핑 경험을 최적화하기 위한 시도가 진행되고 있다. 하지만 이와 같은 시도에도 온라인 소비자가 실제로 웹사이트를 방문해 제품 구매 단계까지 전환될 확률은 매우 낮은 실정이다. 이는 온라인 소비자들이 단지 제품 구매를 위해 웹사이트를 방문하는 것이 아니라 그들의 쇼핑 동기 및 목적에 따라 웹사이트를 다르게 활용하고 탐색하기 때문이다. 따라서 단지 구매가 진행되는 방문 외에도 다양한 방문 형태를 분석하는 것은 온라인 소비자들의 행동을 이해하는데 중요하다고 할 수 있다. 이러한 관점에서 본 연구에서는 온라인 소비자의 탐색 행동의 다양성과 복잡성을 설명하기 위해 실제 E-commerce 기업의 클릭스트림 데이터를 기반으로 세션 단위의 클러스터링 분석을 진행해 탐색 행동을 유형화하였다. 이를 통해 각 유형별로 상세 단위의 탐색 행동과 구매 여부가 차이가 있음을 확인하였다. 또한 소비자 개인이 여러 방문에 걸친 일련의 탐색 유형에 대한 패턴을 분석하기 위해 순차 패턴 마이닝 기법을 활용하였으며, 같은 기간 내에 제품 구매까지 완료한 소비자와 구매를 진행하지 않은 채 방문만 진행한 소비자들의 탐색패턴에 대한 차이를 확인할 수 있었다. 본 연구의 시사점은 대규모의 클릭스트림 데이터를 활용해 온라인 소비자의 탐색 유형을 분석하고 이에 대한 패턴을 분석해 구매 과정 상의 행동을 데이터 기반으로 설명하였다는 점에 있다. 또한 온라인 소매 기업은 다양한 형태의 탐색 유형에 맞는 마케팅 전략 및 추천을 통해 구매 전환 개선을 시도할 수 있으며, 소비자의 탐색 패턴의 변화를 통해 전략의 효과를 평가할 수 있을 것이다.

경기순환과 우리나라 정기선 해운의 영업이익률 변동 요인 (The Economic Cycle and Contributing Factors to the Operating Profit Ratio of Korean Liner Shipping)

  • 목익수;류동근
    • 한국항해항만학회지
    • /
    • 제46권4호
    • /
    • pp.375-384
    • /
    • 2022
  • 해운산업은 수요와 공급뿐만 아니라 여러 경제지표와 사회적 사건 등 복잡한 변수에 의하여 영향을 받으며 순환한다. 본 연구는 우리나라 13개 정기선사에 대하여 30여 년의 영업실적을 분석하여 1990년대 말의 외환위기, 2000년대 말의 글로벌 금융위기, 그리고 최근의 코로나 팬데믹 위기 상황에서 정기선 해운기업의 영업이익률에 어떤 요인들이 영향을 미치는지 분석하였다. 정기선사의 특성을 고려하여 원양과 근해로 구분하고, 한국채택국제회계기준(K-IFRS)에 근거한 영업이익률과 시계열에 의한 해상물동량, 선박량 및 거시경제지표를 이용하여 다중회귀분석으로 그 요인을 분석하였다. 한편 사회적 사건으로 인하여 경제지표가 이상하게 탐지된 경기 침체기에 대하여는 별도로 분석하였다. 그 결과 중국컨테이너운임지수 (CCFI)는 원양 및 근해 정기선사 모두에게 정(+)의 영향을 주었다. 한국 컨테이너 선박량은 원양 정기선사에만 정의 영향을 주었고, 세계물동량과 유가는 근해정기선사 영업이익률에 부(-)의 영향을 미쳤다. 더불어 세계와 우리나라 GDP도 미미하게나마 근해선사 영업이익률에 영향을 주었다. 그 외 중국의 GDP, 환율, 이자율 등은 양 그룹의 영업이익률에 유의미한 영향을 주지 못하였다. 또한 경기침체기 중 2009년 글로벌 금융위기를 제외하고 1998년 외환위기 및 2020년 코로나 팬데믹 기간은 오히려 경제지표와 부의 상관관계를 보여주었다. 본 연구는 해운경기 예측의 복잡성과 어려움을 감안하여 금융비용을 고려하지 않은 영업이익률에 초점을 맞추었고, 3번의 경제·사회적 사건을 포함한 장기간의 실증 분석을 통하여 결론을 도출하였다.

가정간호사 제도에 대한 인식 및 태도 조사연구 (A Study on the recognition and Attitude of Home Health Nursing System)

  • 이성자
    • 한국보건간호학회지
    • /
    • 제12권1호
    • /
    • pp.132-146
    • /
    • 1998
  • This Study was attempted to provide the basic data necessary in the development and introduction of Home Health Nursing System by investigating the recognition and attitude level of Home Health Nursing System. The data were collected by means of questionaires presented to 74 patients who had been admitted in C general hospital in Chon Ju, from June 30, 1997. As the tool for this study, the questionares developed by Kim Yong. Soon, et al (1990) and Han Bok Hee(1993) were modified and supplemented for the aim of this study. The computer was used for data analysis. The items about the charateristics of the subjects and the attitude to the management plan of Home Health Nursing System were represented as the frequency and percentage. The standard deviation and calculation average were produced on the items related to definition, recognition, necessity, expected effect of the attitude of Home Health Nursing System and the items related to admission. The ANOVA test was .used according to the characteristics of variables to analyze the necessity and difference of Home Health Nursing System. The results of this study were as follows 1) The general characteristics of the subjects were as follows ; for sex, man, $58.1\%$ ; for age, 50-59 years, $29.7\%$ ; for the level of education, high school, $51.4\%$ ; $79.7\%$ of them were married; for the family forms, small family, $73.0\%$ ; and $68.9\%$ of them take the monthly income over 100 million won. 2) The characteristics related to admissions of the subjects were as follows ; for clinic, surgical department, $78.4\%$ ; addmission not more then 7days, $47.3\%$ ; for the operation-performance $71.6\%$ of them were experienced; for the admission route, via outpatients clinic, $54.1\%$ ; for waiting period to the admission day, 1-2 days, $71.6\%$. 3) The difficulties comming from the hospitalization were related mostly to the factor that they felt hospital life more inconvenient than home.(3.66) The reasons for the difficulties in the admission which was due to insufficient beds in the hospital was related to the concentration to the general hospital because of 'The Whole National Medical Insurance System'(4.05). 4) On the previous informations about the Home Health Nursing System, those who have heard of only the name were 42 $(56.8\%)$, and on the recognition of it, they thought that it is periodic treatment by the licenced nurses for the recovering pateints after early discharge(3.73). On the attitude about the necessity of Home Health Nursing System, they thought that it is necessary because of the increasing trend of a psychological disease by the change of environment and complexity of the social structure(4.24). On the expected effect of Home Health Nursing System, they answered that it is convinient for the family of the patient to take care of them(4.l8). 5) On the attitude to the management plan of the Home Health Nursing System, those who had intention to participate in the system in the case of systemic support were 42(56.8). In the visiting time, 'visit periodically' and 'visit when the patient needs' were $28(37.8\%)$ respectively. For the application of medical insurance, if possoble, they will use $(91.9\%)$; for the method of payment for the treatment, 'pay by the time required' was $23(31.1\%)$, for the subject of management, 'National public institute must operate' was $33(44.6\%)$. 6) The relationship between the general characteristics of the subjects and the necessity of Home Health Nursing System showed the notable difference in the age (F=3.508, P<0.05) and marrage state (F=5.402, P<.023).

  • PDF

계층 클러스터 트리 기반 라만 스펙트럼 식별 고속 검색 알고리즘 (A Hierarchical Cluster Tree Based Fast Searching Algorithm for Raman Spectroscopic Identification)

  • 김순금;고대영;박준규;박아론;백성준
    • 한국산학기술학회논문지
    • /
    • 제20권3호
    • /
    • pp.562-569
    • /
    • 2019
  • 최근에 원 거리에서 폭발 물질의 감지를 위해 라만 분광 기기의 관심이 점차 증가하고 있다. 더불어 측정된 화학물질에 대한 라만 스펙트럼을 대용량 데이터베이스의 알려진 라만 스펙트라와 비교하여 식별할 수 있는 고속 검색 방법에 대한 요구도 커지고 있다. 지금까지 가장 간단하고 널리 사용되는 방법은 주어진 스펙트럼과 데이터베이스 스펙트라 사이의 유클리드 거리를 계산하고 비교하는 방법이다. 하지만 고차원 데이터의 속성으로 검색의 문제는 그리 간단하지 않다. 가장 큰 문제점중의 하나는 검색 방법에 있어서 연산량이 많아 계산 시간이 너무 오래 걸린다는 것이다. 이러한 문제점을 극복하기 위해, 우리는 정렬된 분산에 따른 MPS Sort+PDS 방법을 제안하였다. 이 방법은 벡터의 두 개의 주요한 특징으로 평균과 분산을 사용하여 후보가 될 수 없는 많은 코드워드를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 본 논문에서 우리는 기존의 방법보다 더욱 더 향상된 2가지 새로운 방법의 고속 검색 알고리즘을 제안한다. PCA+PDS 방법은 전체 데이터를 사용하는 거리 계산과 똑같은 결과를 가지면서 PCA 변환을 통해 데이터의 차수를 감소시켜 계산량을 줄여준다. Hierarchical Cluster Tree 알고리즘은 PCA 변환된 스펙트라 데이터를 사용하여 이진 계층 클러스터 트리를 만든다. 그런 후 입력 스펙트럼과 가장 가까운 클러스터부터 검색을 시작하여 후보가 될 수 없는 많은 스펙트라를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 실험은 정렬된 분산에 따른 MPS Sort+PDS와 비교하여 PCA+PDS는 60.06%의 성능 향상을 보였다. Hierarchical Cluster Tree는 PCA+PDS와 비교하여 17.74%의 성능향상을 보였다. 실험결과는 제안된 알고리즘이 고속 검색에 적합함을 확인시켜 준다.

Minimac3와 Beagle 프로그램을 이용한 한우 770K chip 데이터에서 차세대 염기서열분석 데이터로의 결측치 대치의 정확도 분석 (Imputation Accuracy from 770K SNP Chips to Next Generation Sequencing Data in a Hanwoo (Korean Native Cattle) Population using Minimac3 and Beagle)

  • 안나래;손주환;박종은;채한화;장길원;임다정
    • 생명과학회지
    • /
    • 제28권11호
    • /
    • pp.1255-1261
    • /
    • 2018
  • DNA 염기서열의 발전과 많은 단일염기서열변이 정보(Single Nucleotide polymorphism, SNP)의 발굴은 유전 분석을 가능하게 만들었다. 단일염기서열변이 정보가 사람의 유전체뿐만 아니라 가축의 유전체에서도 이용할 수 있게 됨에 따라서 SNP 칩 마커를 통해 유전자형의 분석이 가능하게 되었다. 여러 유전자형 대치프로그램 중에서도 Minimac3 소프트웨어는 비교적 정확성이 높고, 계산의 효율성을 위해 분석을 단순화하여 유전자형의 결측치 대치 분석 시간을 단축시킨다. 따라서 본 연구에서는 Minimac3 프로그램을 사용하여 한우 1,226두 770K SNP 칩 데이터와 311두 차세대 염기서열분석 데이터를 이용하여 유전자형 결측치 대치를 실행해 보았다. 그 결과 염색체별 정확도는 약 94~96%의 정확도를 나타냈으며, 개체별 정확도는 약 92~98%의 정확도를 나타냈다. 유전자형의 결측치 대치의 완료 후, R Square ($R^2$) 값이 0.4 이상인 SNP는 총 SNP의 약 91%였다. $R^2$ 값이 0.6 이상인 SNP는 84%였으며, $R^2$ 값이 0.8 이상인 SNP는 70%였다. 대립유전자형빈도 차이를 기준으로 (0, 0.025), (0.025, 0.05), (0.05, 0.1), (0.1, 0.2), (0.2, 0.3), (0.3, 0.4), (0.4, 0.5)의 7구간에 해당하는 $R^2$ 값은 64~88%였다. 결측치 대치의 총 분석 시간은 약 12시간이 걸렸다. 추후의 유전체 데이터 세트의 크기와 복잡성이 증가하는 SNP 칩 연구에서 Minimac3를 사용한 유전체 결측치 대치법은 한우의 판별에 있어서 칩 데이터의 신뢰도를 향상 시킬 수 있을 것으로 본다.

온톨로지 기반의 수강지도 시스템 (Ontology-based Course Mentoring System)

  • 오경진;윤의녕;조근식
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.149-162
    • /
    • 2014
  • 수강지도는 학생의 졸업인증이나 공학교육인증 이수를 위해 수강 신청 이전에 수행되는 과정을 지칭한다. 수강지도는 학생의 수강이력 점검과 향후 수강 과목의 안내 등을 포함하여 학생들의 졸업 및 교과과정 인증과 관련된 중요한 역할을 하고 있다. 현재 대부분 대학에서는 수강지도를 위한 전산시스템의 부재로 인해 지도교수가 직접 수동적으로 수강지도를 진행하고 있다. 하지만 이러한 수동적인 방식의 수강지도는 지도교수가 각 학생에 대한 정보를 분석해야 하고, 때때로 휴먼에러를 일으키게 된다. 수강신청이 학기 단위로 이루어지기 때문에 휴먼에러로부터 발생된 피해는 원상태로 되돌리는 것이 거의 불가능하다. 따라서 수강지도를 진행함에 있어 자동화된 시스템은 필수적인 요소로 판단된다. 관계 데이터 모델을 이용한 수강지도 시스템의 도입은 수동적인 수강지도의 문제점을 해결할 수 있게 해준다. 하지만 교육과정 및 인증제도의 변화에 따라 기존 시스템의 스키마 변경이 요구되고, 수강 과목 사이에 존재하는 관계 및 의미적인 검색을 제공하는 것이 어렵다는 한계가 존재한다. 본 논문에서는 수강지도 시스템을 위한 수강지도 온톨로지를 모델링하고, 온톨로지 기반의 수강지도 시스템을 설계한다. 온톨로지 인스턴스 생성을 위해 JENA 프레임워크를 이용하여 온톨로지 생성 모듈을 개발하였고, 실험에 참가한 학생의 수강 이력 데이터를 기반으로 온톨로지 인스턴스를 생성하고 추론과정을 통해 트리플 저장소에 저장하였다. 실험은 제안하는 시스템이 학생들이 향후 수강할 수 있는 과목을 모두 제공하는지 여부와 제공되는 과목에 대한 정보 및 학점 계산들이 정확한 지를 측정하였다. 실제 학생의 수강내역을 이용한 실험의 결과는 온톨로지 기반의 수강지도 시스템이 현 수강지도 시스템의 수동적 방법을 해결하고, 사람이 지도한 내용과 같은 내용을 도출하는 것을 확인함으로써 제안하는 시스템의 유효성을 보여준다.

태양열시설이 전통사찰의 경관경험에 미치는 영향 - 통도사 진입경관을 중심으로 - (Impact of Solar Energe Facility on the Landscape Experience of Traditional Temple - Focused on the Entrance Way of Tongdosa -)

  • 이영경;김정은;이서율
    • 한국전통조경학회지
    • /
    • 제28권3호
    • /
    • pp.114-121
    • /
    • 2010
  • 전통사찰은 아름다운 경관 안에 문화적 가치가 있는 건조물이 조화를 이루는 역사적 장소로서, 수행과 기도, 그리고 포교가 진행되는 숨 쉬는 문화유산으로서의 강한 장소성과 독특한 가치가 있는 곳이다. 문화유산으로서의 전통사찰의 가치와 장소성 보존은 사찰경관과 밀접하게 연관된다. 그러나 이러한 경관조성에 필요한 전통적인 건축물은 에너지 효율성이 매우 낮아 전통사찰 관리에 심각한 문제점을 유발하고 있다. 특히 산중 사찰의 경우에는 겨울철 난방을 위한 에너지 소모량과 비용이 매우 높아, 이에 대한 대책이 시급한 실정이다. 따라서 신재생 에너지원 이용을 통한 에너지 효율성 향상은 변화하는 사회에 적극적으로 대처하기 위해 전통사찰이 해결해야 할 중요한 과제이다. 그러나 이러한 시도가 전통사찰의 경관을 훼손하면 자칫 사찰의 장소성을 훼손하고 더 나아가 문화유산으로서의 사찰의 가치를 저하시킬 우려가 크다. 본 연구에서는 전통사찰에 설치된 신재생에너지(태양열) 시설물이 사찰의 경관경험에 미치는 영향을 조사하고, 이를 바탕으로 전통사찰의 가치와 장소성 보존을 위한 경관 개선방안을 제시하고자 한다. 이를 위하여 전통사찰 통도사의 진입경관을 연구대상경관으로 설정하고 사찰의 경관경험을 파악할 수 있는 경관이미지와 사찰 정체성, 경관만족도, 경관개선 필요성 등을 설문항목으로 선정하였다. 설문조사에는 대학 학부학생 180명이 참여하였다. 중요연구결과를 바탕으로 태양열시설의 도입 시 필요한 경관개선방안을 제시하면 세 가지로 요약된다. 첫째 태양열시설의 설치는 사찰의 경관경험에 부정적 영향을 미치므로 이를 저감하기 위한 다양한 방안(산림지역에 설치, 식물을 이용한 차폐)이 요구된다. 둘째, 사찰경관의 관리는 심미성과 사찰 정체성 확보를 중심으로 하며, 개방성을 확보하는 방향으로 설정하는 것이 제안된다. 특히, 심미성은 조화성, 전통성, 자연성, 흥미성의 조성이 중요한 것으로 판단된다. 셋째, 이와 함께 인공구조물의 비율과 규모, 그리고 형태적 특성에 대한 전략과 세부지침을 마련한다면 전통사찰의 장소성과 가치를 보존 및 유지할 수 있을 것으로 판단된다.

비인두암 Vertical MLC VMAT plan 유용성 평가 (Evaluating efficiency of Vertical MLC VMAT plan for naso-pharyngeal carcinoma)

  • 채승훈;손상준;이제희
    • 대한방사선치료학회지
    • /
    • 제33권
    • /
    • pp.127-135
    • /
    • 2021
  • 목 적 : 비인두암 VMAT 치료 시 콜리메이터 각도 273°와 350°를 사용한 2회전 치료계획(Vertical MLC VMAT plan, 이하 VMV plan)과 콜리메이터 각도 20°와 340°를 사용한 2회전 치료계획(Complemental MLC VMAT plan, 이하 CMV plan)과의 비교 분석을 통해 유용성을 평가해 보고자 한다. 대상 및 방법 : 본원에서 VMAT 치료를 받은 비인두암 환자 30명을 대상으로 하였다. 전산화치료계획은 Eclipse, PO, AcurosXB 알고리즘을 이용하였으며, 치료기는 Vital-beam을 사용하였다. 치료계획은 갠트리 회전반경이 각각 360°인 두 개의 회전(Arc)을 6MV를 이용하여 생성하고, 콜리메이터 각도 변화에 의한 영향을 확인하기 위해 273°와 350°로 설정한 VMV plan과 20°와 340°로 설정한 CMV plan을 수립하였다. 선량용적 히스토그램에서 확인 및 산출된 계획표적용적(PTV)과 결정장기(OAR)들의 선량지표들과 변조복잡성지수(MCSv), MU, 치료시간에 대해 기술통계 및 대응표본 t-검정을 실시하였다. 그리고 대상별로 두 치료계획의 MCSv의 차이와 각각의 평가지표들의 차이 간 상관관계가 있는지 확인하기 위해 피어슨의 상관관계 분석을 실시하였다. 결 과 : PTV 평가 지표의 경우, VMV Plan에서 PTV_67.5의 CI가 3.76% 개선되었으며, OAR의 경우 척수(-14.05%)와 뇌 줄기(-9.34%)의 선량감소 효과가 두드러지게 나타났다. 그리고 귀밑샘들(왼쪽 : -5.38%, 오른쪽 : -5.97%)과, 시각기관들(왼쪽 시신경 : -4.88%, 오른쪽 시신경 : -5.80%, 시신경교차 : -6.12%, 왼쪽 수정체 : -6.12%, 오른쪽 수정체 : -5.26%), 청각기관(왼쪽 : -11.74%, 오른쪽 : -12.31%)과 갑상샘(-2.02%)에서의 선량감소효과도 확인할 수가 있었다. 또한 MCSv가 VMV Plan에서 5.31% 높게 나왔으며, MU의 경우에 6.11% 낮은 것으로 나타났다. 그리고 두 치료계획의 MCSv의 차이는 PTV_54의 CI(r=-0.55)의 차이, PTV_48의 CI(r=-0.43)의 차이와 유의한 음(-)의 상관관계를 보였고, 척수(r=0.40), 뇌줄기(r=0.34), 양쪽 침샘들(왼쪽 : r=0.36, 오른쪽 : r=0.37)의 차이와 양(+)의 상관관계를 보였다. 이는 VMV plan의 moluation 복잡성이 CMV plan에 비해 상대적으로 높아 질 때, PTV_54, 48의 CI 개선 및 척수, 뇌줄기, 양쪽침샘들의 선량 감소 효과가 커지는 것을 의미하며, 이러한 분석결과들을 바탕으로 VMV plan의 modulation에 대한 효율성이 CMV plan 보다 크다는 것을 확인할 수 있었다. (위 모든 값에 대해 유의수준은 p<.05) 결 론 : VMV Plan은 CMV plan과 비교하여 MLC가 더 효율적으로 modulation할 수 있도록 함으로써, 치료계획의 질을 향상 시키는데 도움이 될 것이라 사료된다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.