• 제목/요약/키워드: program similarity

검색결과 312건 처리시간 0.023초

광화유체의 비등과 희석에 의한 통영 천열수계 Au-Ag-Te 장화작용에 대한 반응경로 모델링 (Au-Ag-Te Mineralization by Boiling and Dilution of Meteoric Ground-water in the Tongyeong Epithermal sold System, Korea: Implications from Reaction Path Modeling)

  • Maeng-Eon Park;Kyu-Youl Sung
    • 자원환경지질
    • /
    • 제34권6호
    • /
    • pp.507-522
    • /
    • 2001
  • 통영광산은 첨열수광상으로서 능망간석 , 백운모, 일라이트, 황철석 , 방연석 , 황동석 , 섬아연석 , 아칸다이트 및 헤사이트등의 광물을 수반하는 초기의 광석광물 침전시기와 후기의 맥석광물 침전시기로 구분된다. 초기는 반복적인 대상구조를 띠고, 황화광물이 침전된 시기로서 텔루리움 광물과 함께 엘렉트럼이 산출된다. 후기에는 주로 단산염 광물과 천금속광물이 침전되었다. 통영 열수계에서 광화단계에 따른 상이한 열수유체의 변천과정을 구체적으로 규명하기 위하여 프로그램 CHILLER를 이용한 수치모델링이 실시되었다. 반응경로 모델링은 28$0^{\circ}C$에서 모암인 안산암과의 반응을 비롯하여, 27$0^{\circ}C$에서 12$0^{\circ}C$까지의 단순한 등압 냉각, 비등과 지하수의 혼입에 따른 희석 및 압력파 온도가 감소되는 조건에서 수행하였다. 모델링 결과 초기 광화유체는 산성용액(pH=5.7)으로 상대적으로 높은 염농도와 금속원소 함량이 높다. 장화유체 내의 금의 함량은 열수계의 천금속원소 총량과 황화물의 활동도에 의해 지배된다. 통영 천열수계에서의 광화작용은 천부에서 일어난 참화유체의 비등과 이에 수반된 가열된 지하수의 흔입에 의한 반응경로를 반영하며, 현미경에서 관찰된 광물공생 특성과 모델링에 의한 침전광물의 조합 및 엘렉트럼의 화학조성 등에서 동일한 경향을 나타낸다. 이러한 유사성은 Te 함유하는 천열수 금 . 은광상이 열수계에서의 비등과 유체혼합(희석)에 의해 생성되었음을 지시한다. 반응경로 모델링 연구는 광상성인을 이해하는 중요한 수단이며, 유사한 지질환경에서의 광강탐사에 유용한 자료로 활용될 것으로 생각된다.

  • PDF

국내 한우의 타일레리아 주요항원단백질 유전자의 다양성 (Genetic Diversity in the Major Surface Protein Gene of Theileria Buffeli in Korean Indigenous Cattle)

  • 유도현;이영화;채준석;박진호
    • 한국임상수의학회지
    • /
    • 제27권5호
    • /
    • pp.501-507
    • /
    • 2010
  • 본 연구는 국내 타일레리아에서 주요항원단백질(major surface protein) 유전자의 다양성을 분석해 보고자 수행되었다. 나아가 Msp 유전자의 다양성과 타일레리아의 병원성과의 관계도 분석하였다. 제주에 있는 목장으로부터 총 177마리의 한우 혈액을 공시재료로 사용하여 혈액검사와 18S rRNA를 표적으로 하는 PCR을 실행하였다. 그 후, 타일레리아 18S rRNA에 양성인 28마리 (16마리 빈혈군과 12마리의 정상군)를 무작위로 선발하여 Msp유전자의 염기 서열을 반복하여 분석하였다. 총 56개의 염기서열 결과는 다변성 부위(517-571 bp)에 따라 크게 type I에서 type V까지 5가지 형태로 나눌 수 있었는데, 이는 유전자은행(GenBank)에 등록되어 있는 다음의 유전자와 98.9% 이상 일치하였다 (Theileria spp. from China-EU584237; T. sergenti from China-DQ078264; Theileria spp. from Thailand-AB081329; Theileria spp. from Japan-AB218442; T. sergenti from Japan-AB016280). 그 분포는 22, 15, 9, 8, 2개가 각각 type I에서 V까지 분포하였고 빈혈과 관계없이 type I이 가장 많이 나타나는 것으로 밝혀졌다(37.5%의 빈혈군과 41.7%의 정상군). 나머지 type중에서는 type II가 빈혈군에서 가장 많이(37.5%) 나타났으며, 반면 type IV는 정상군에서 많이 (25%) 나타났다. 본 연구는 국내 타일레리아 Msp유전자의 다양성을 밝히는데 좋은 자료로 활용될 수 있을 것이다.

서울 사직단(社稷壇)의 입지(立地)와 공간구성특성(空間構成特性)에 관한 기초연구(基礎硏究) (Basic Studies on the Location and Spatial Organization Characteristics of the Seoul Sajikdan)

  • 최승식;심우경;유종호;전혜원;최종희
    • 한국전통조경학회지
    • /
    • 제30권1호
    • /
    • pp.146-158
    • /
    • 2012
  • 본 연구는 조선시대 국가대사 중 하나인 사직대제를 행하는 장소로서 중요한 위치를 점유하고 있는 서울 사직단의 조경적 특성을 파악하기 위한 기능론적 단계로 조영실제, 입지, 공간구성 특성을 구명하는데 목적을 두고 수행되었다. 연구방법은 문헌조사와 현지조사로 구분하여 이루어졌으며, 연구결과는 다음과 같다. 첫째, 조영의 경우 태종16년(1416) 사직단의 모습을 갖추게 되었으며, 이후 임란, 숙종, 일제강점기 때 공간구성의 변화를 거쳤으며, 복원사업 (1988)이 이루어져 현재의 모습을 갖추게 되었음을 파악할 수 있었다. 둘째, 입지의 경우 사직단은 한양의 내사산(內四山) 중 우백호(右白虎)인 인왕산의 남동쪽으로 뻗어내려 온 산맥과 연접하며, 서북쪽이 높고 동남쪽이 낮은 서고동저의 지형을 보이며, 매동초등학교, 사직주민센터, 단군성전 등이 공간을 한정함을 파악할 수 있었다. 셋째, 공간구성의 경우 중앙에 사단과 직단이 음양을 이루어 배치되고, 유원과 주원(周垣)의 사면에 유문과 신문(神門)을 두어 중심과 사방위를 가진 오행적 구성을 보임을 파악할 수 있으며, 사직단의 부속건물들은 기능의 유사성과 이용의 편의성을 고려하여 배치되었을 것으로 사료된다. 넷째, 구성요소의 경우 단유시설로는 사직대제(社稷大祭)를 봉행 시 제사를 올리는 사단과 직단과 두 단을 위요하는 유원, 유원 밖의 담인 주원 등이, 건조물로는 사직단 대문, 신실, 안향청 등이, 조경수목으로는 소나무가 주수종이었으나, 왕벚나무, 느티나무, 단풍나무 등 일반적인 조경수가 식재되어 정비가 요구된다 하겠다.

SSR 분자마커를 이용한 찰옥수수 및 종실용 옥수수 자식계통들의 핵심집단에 대한 유전적 다양성 및 집단구조 분석 (Analysis of Genetic Diversity and Population Structure for Core Set of Waxy and Normal Maize Inbred Lines using SSR Markers)

  • 사규진;김진아;박기진;박종열;고병대;이주경
    • 한국육종학회지
    • /
    • 제43권5호
    • /
    • pp.430-441
    • /
    • 2011
  • 본 연구는 총 50개의 SSR 마커를 이용하여, 찰옥수수 및 종실용 옥수수 핵심집단(찰옥수수 40계통, 종실용 옥수수 40계통)의 자식계통들의 유전적 다양성, 집단구조 및 계통유연관계를 분석하였다. 1. 그 결과 65bp에서 225bp 크기의 범위로 총 242개의 대립단편들을 증폭시켰다. SSR primer들에서 증폭된 대립단편의 수는 최소 2개에서부터 최대 9개까지의 범위로 나타났고, 평균 4.84개가 증폭되었다. 그리고 GD값은 0.420에서 0.854의 범위로 나타났고, 평균 0.654의 값을 나타내었다. 2. 80개의 옥수수 자식계통들의 집단구조를 분석한 결과, 13개의 찰옥수수 자식계통은 group I에 포함되었고, Group II는 7개의 찰옥수수 자식계통과 38개의 종실용 옥수수 자식계통들이 포함되었다. 나머지 22개의 자식계통들은 admixed group에 포함되었으며, 20개 찰옥수수 자식계통과 2개의 종실용 옥수수 자식계통으로 구성되어있다. 3. UPGMA법에 의한 계통유연관계 분석 결과, 80개 옥수수 자식계통들은 유전적 유사성 31.7% 수준에서 크게 3개의 그룹으로 나누어졌다. Group I은 40개의 찰옥수수 자식계통과 11개의 종실용 옥수수 자식계통을 포함하고 있었고, Group II는 27개의 종실용 옥수수 자식계통을, 그리고 Group III은 단지 2개의 종실용 옥수수 자식계통을 포함하고 있었다. 따라서 본 연구의 결과는 앞으로 강원도 농업기술원 옥수수시험장에서 육성한 찰옥수수 및 종실용 옥수수 자식계통들에 대한 유전자원 관리 및 선발 그리고 교배조합 구성 및 예측 등에 유용한 정보를 제공할 것으로 기대된다.

소셜네트워크 빅데이터를 활용한 코로나 19에 따른 프로야구 관람문화조사 (Professional Baseball Viewing Culture Survey According to Corona 19 using Social Network Big Data)

  • 김기탁
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권6호
    • /
    • pp.139-150
    • /
    • 2020
  • 본 연구의 자료처리는 텍스톰(textom)과 소셜미디어의 단어를 중심으로 3가지 영역인 '코로나 19와 프로야구', '코로나 19와 프로야구 무관중', '코로나 19와 프로스포츠'에 대해 웹 환경에서 데이터 수집과 정제작업을 실시한 후 일괄 처리하였으며, 이를 시각화하기 위해 Ucinet6프로그램을 활용하였다. 구체적으로 웹 환경의 수집은 네이버, 다음, 구글의 채널을 활용하였고, 추출된 단어들 중 전문가회의를 통해 30개의 단어로 요약 정리하여 최종 연구에 활용하였다. 30개의 추출된 단어를 매트릭스를 통해 시각화하였으며, 단어의 유사성과 공통성의 군집을 파악하기 위해 CONCOR분석을 실시하였다. 분석결과 코로나 19와 프로야구에 관련된 군집은 1개의 중심클러스터와 5개의 주변클러스터로 구성되었고 코로나 19여파에 따른 프로야구 개막과 관련된 내용을 주로 검색하고 있는 것으로 나타났다. 코로나 19와 프로야구 무관중에 관련된 군집은 1개의 중심 클러스터와 5개의 주변클러스터로 구성되었으며, 코로나 19에 따른 프로야구 경기와 관련된 프로야구 입장의 키워드를 주로 검색하고 있는 것으로 나타났다. 코로나 19와 프로스포츠에 관련된 군집은 1개의 중심클러스터와 5개의 주변클러스터로 구성되었으며, 코로나 19의 여파에 따른 프로스포츠 시작과 관련된 키워드를 주로 검색하고 있는 것으로 나타났다. 이를 종합해보면 포스트 코로나 시대의 프로야구는 많은 변화가 있을 것이라 예상된다. 특히 응원문화는 관중들이 원하는 정도의 만족감은 없겠지만 관중들이 누릴 수 있는 직접관람의 기회를 누리기 위해 야구장에서도 코로나 19를 극복하기 위한 하나의 일상으로의 행동강령이 잘 유지되어야 할 것이다. 관람문화 또한 라이브커머스, AR/VR, O4O(Online for Offline)등의 4차 산업혁명의 기술도입으로 현장감 있는 쌍방향 소통이 가능한 인터렉티브 소통의 디지털이 구현돼야 할 것이다. 포스트 코로나 시대는 프로스포츠에도 새로운 형태의 패러다임이 구축될 것이다. 랜선 응원, SNS를 활용한 응원, 실시간 동시시청, 라이브 채팅응원, 편파중계 등 다양한 형태의 응원문화가 새로운 창작 콘텐츠 형태로 진화할 것이며, 팬들의 욕구를 충족할 수 있는 새로운 형태의 패러다임이 구축돼야 하겠다.

Generative Adversarial Network-Based Image Conversion Among Different Computed Tomography Protocols and Vendors: Effects on Accuracy and Variability in Quantifying Regional Disease Patterns of Interstitial Lung Disease

  • Hye Jeon Hwang;Hyunjong Kim;Joon Beom Seo;Jong Chul Ye;Gyutaek Oh;Sang Min Lee;Ryoungwoo Jang;Jihye Yun;Namkug Kim;Hee Jun Park;Ho Yun Lee;Soon Ho Yoon;Kyung Eun Shin;Jae Wook Lee;Woocheol Kwon;Joo Sung Sun;Seulgi You;Myung Hee Chung;Bo Mi Gil;Jae-Kwang Lim;Youkyung Lee;Su Jin Hong;Yo Won Choi
    • Korean Journal of Radiology
    • /
    • 제24권8호
    • /
    • pp.807-820
    • /
    • 2023
  • Objective: To assess whether computed tomography (CT) conversion across different scan parameters and manufacturers using a routable generative adversarial network (RouteGAN) can improve the accuracy and variability in quantifying interstitial lung disease (ILD) using a deep learning-based automated software. Materials and Methods: This study included patients with ILD who underwent thin-section CT. Unmatched CT images obtained using scanners from four manufacturers (vendors A-D), standard- or low-radiation doses, and sharp or medium kernels were classified into groups 1-7 according to acquisition conditions. CT images in groups 2-7 were converted into the target CT style (Group 1: vendor A, standard dose, and sharp kernel) using a RouteGAN. ILD was quantified on original and converted CT images using a deep learning-based software (Aview, Coreline Soft). The accuracy of quantification was analyzed using the dice similarity coefficient (DSC) and pixel-wise overlap accuracy metrics against manual quantification by a radiologist. Five radiologists evaluated quantification accuracy using a 10-point visual scoring system. Results: Three hundred and fifty CT slices from 150 patients (mean age: 67.6 ± 10.7 years; 56 females) were included. The overlap accuracies for quantifying total abnormalities in groups 2-7 improved after CT conversion (original vs. converted: 0.63 vs. 0.68 for DSC, 0.66 vs. 0.70 for pixel-wise recall, and 0.68 vs. 0.73 for pixel-wise precision; P < 0.002 for all). The DSCs of fibrosis score, honeycombing, and reticulation significantly increased after CT conversion (0.32 vs. 0.64, 0.19 vs. 0.47, and 0.23 vs. 0.54, P < 0.002 for all), whereas those of ground-glass opacity, consolidation, and emphysema did not change significantly or decreased slightly. The radiologists' scores were significantly higher (P < 0.001) and less variable on converted CT. Conclusion: CT conversion using a RouteGAN can improve the accuracy and variability of CT images obtained using different scan parameters and manufacturers in deep learning-based quantification of ILD.

오픈소스 소프트웨어를 활용한 고고 유물의 디지털 실측 연구 (A Study on the Digital Drawing of Archaeological Relics Using Open-Source Software)

  • 이호선;안형기
    • 헤리티지:역사와 과학
    • /
    • 제57권1호
    • /
    • pp.82-108
    • /
    • 2024
  • 고고 자료의 기록방식이 아날로그 기록에서 디지털로 전환되면서 3D 스캐닝 기술의 도입은 본격화되었다. 현재 3D스캔과 사진측량을 이용한 고고 자료의 디지털 기록에 대한 연구와 도입은 지속적으로 이루어지고 있다. 하지만 비용, 인력 문제 등으로 인해 대부분의 매장문화재 기관에서는 적극적인 디지털 기술의 도입을 주저하고 있다. 본고는 3D 스캔 방식 중 효율성이 가장 높다고 평가되는 사진측량 기술을 이용하여 오픈소스 소프트웨어를 활용한 유물의 디지털 실측 방법을 제시하고자 한다. 유물의 디지털 실측 절차는 크게 3D 모델 획득, 3D 모델 편집 및 입단면도 제작, 전자도면 작성의 세 단계로 이루어진다. 디지털 기술 적용의 접근성을 살펴보기 위해 전 과정은 오픈소스 소프트웨어만을 이용하였다. 연구 결과 정량적 평가에서 실제 유물과 3D 모델의 수치 데이터 간 계측의 편차가 크지 않았다. 또한, 오픈소스 소프트웨어와 상용 소프트웨어 간 정량적 품질 비교분석 결과 유사도가 높았다. 다만 데이터 처리시간은 상용 소프트웨어의 성능이 우위에 있었다. 이는 지속적인 알고리즘 개선으로 인한 연산속도 향상의 결과로 판단된다. 정성적 평가에서는 메시 및 텍스처 품질의 차이가 일부 발생하였다. 오픈소스 소프트웨어로 생성된 3D 모델은 메시표면에 노이즈가 다수 발생하거나 메시의 표면이 부드럽지 않고 유물의 제작흔, 문양의 표현을 확인하기 어려웠다. 하지만 일부 프로그램에서 정량적·정성적 평가에서 상용 소프트웨어에 견줄 만한 품질을 획득할 수 있었다. 3D 모델 편집을 위한 오픈소스 소프트웨어에서는 사진실측 결과물의 후처리, 정합, 병합뿐만 아니라 유물 실측에 필요한 스케일 조정, 입단면도 제작 및 이미지 렌더링까지 가능하였다. 이후 오픈소스 캐드 프로그램에서 트레이싱하여 최종 도면을 완성하였다. 고고학 연구에서 사진실측의 적용은 발굴과정부터 보고서 작성 그리고 3D 모델 데이터의 수치정보를 이용한 연구 등 활용 가능성이 매우 높다. 컴퓨터 비전의 획기적인 발전으로 오픈소스 소프트웨어의 종류도 다양해졌고 성능도 상당부분 개선된 것으로 확인되었다. 누구나 쉽게 디지털 기술의 적용이 가능한 현재 고고 자료의 3D 모델 데이터의 획득은 문화유산의 보존과 연구 활성화를 위한 기초자료로 활용될 수 있다.

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.

K-Means Clustering 알고리즘과 헤도닉 모형을 활용한 서울시 연립·다세대 군집분류 방법에 관한 연구 (A Study on the Clustering Method of Row and Multiplex Housing in Seoul Using K-Means Clustering Algorithm and Hedonic Model)

  • 권순재;김성현;탁온식;정현희
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.95-118
    • /
    • 2017
  • 최근 도심을 중심으로 연립 다세대의 거래가 활성화되고 직방, 다방등과 같은 플랫폼 서비스가 성장하고 있다. 연립 다세대는 수요 변화에 따른 시장 규모 확대와 함께 정보 비대칭으로 인해 사회적 문제가 발생 되는 등 부동산 정보의 사각지대이다. 또한, 서울특별시 또는 한국감정원에서 사용하는 5개 또는 25개의 권역 구분은 행정구역 내부를 중심으로 설정되었으며, 기존의 부동산 연구에서 사용되어 왔다. 이는 도시계획에 의한 권역구분이기 때문에 부동산 연구를 위한 권역 구분이 아니다. 이에 본 연구에서는 기존 연구를 토대로 향후 주택가 격추정에 있어 서울특별시의 공간구조를 재설정할 필요가 있다고 보았다. 이에 본 연구에서는 연립 다세대 실거래가 데이터를 기초로 하여 헤도닉 모형에 적용하였으며, 이를 K-Means Clustering 알고리즘을 사용해 서울특별시의 공간구조를 다시 군집하였다. 본 연구에서는 2014년 1월부터 2016년 12월까지 3년간 국토교통부의 서울시 연립 다세대 실거래가 데이터와 2016년 공시지가를 활용하였다. 실거래가 데이터에서 본 연구에서는 지하거래 제거, 면적당 가격 표준화 및 5이상 -5이하의 실거래 사례 제거와 같이 데이터 제거를 통한 데이터 전처리 작업을 수행하였다. 데이터전처리 후 고정된 초기값 설정으로 결정된 중심점이 매번 같은 결과로 나오게 K-means Clustering을 수행한 후 군집 별로 헤도닉 모형을 활용한 회귀분석을 하였으며, 코사인 유사도를 계산하여 유사성 분석을 진행하였다. 이에 본 연구의 결과는 모형 적합도가 평균 75% 이상으로, 헤도닉 모형에 사용된 변수는 유의미하였다. 즉, 기존 서울을 행정구역 25개 또는 5개의 권역으로 나뉘어 실거래가지수 등 부동산 가격 관련 통계지표를 작성하던 방식을 속성의 영향력이 유사한 영역을 묶어 16개의 구역으로 나누었다. 따라서 본 연구에서는 K-Means Clustering 알고리즘에 실거래가 데이터로 헤도닉 모형을 활용하여 연립 다세대 실거래가를 기반으로 한 군집분류방법을 도출하였다. 또한, 학문적 실무적 시사점을 제시하였고, 본 연구의 한계점과 향후 연구 방향에 대해 제시하였다.

지능형 검색엔진을 위한 색상 질의 처리 방안 (Color-related Query Processing for Intelligent E-Commerce Search)

  • 홍정아;구교정;차지원;서아정;여운영;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.109-125
    • /
    • 2019
  • 지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.