• 제목/요약/키워드: extracting model

검색결과 866건 처리시간 0.024초

A Study on Intelligent Skin Image Identification From Social media big data

  • Kim, Hyung-Hoon;Cho, Jeong-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.191-203
    • /
    • 2022
  • 화장품 및 뷰티산업에서 고객 맞춤형 제품과 서비스를 제공하는 것은 주요 기술 트렌드이고, 피부상태 진단과 관리는 중요한 필수기능이다. 고객의 요구 수준은 더욱더 높아지고 있으며 이에 대한 다양하고 섬세한 고민과 요구 사항이 소셜미디어 커뮤니티에서 활발하게 다루어지고 있다. 소셜미디어 상의 이미지는 매우 다양하고 비정형적이므로 피부상태 진단 및 관리에 필요한 체계적인 피부 이미지 식별을 위한 시스템이 필요하다. 본 논문에서는 소셜미디어 인스타그램에서 수집한 빅데이터로부터 피부 이미지 데이터를 지능적으로 식별하고, 피부상태 진단 및 관리를 위한 정형화된 피부 샘플 데이터를 추출하는 시스템을 개발하였다. 본 논문에서 제안한 시스템은 빅데이터수집분석단계, 피부이미지분석단계, 훈련데이터준비단계, 인공신경망훈련단계, 피부이미지식별단계로 구성된다. 빅데이터수집분석단계에서는 인스타그램으로부터 빅데이터를 수집하고 피부 상태 진단 및 관리를 위한 이미지 정보를 분석결과로 저장한다. 피부이미지분석단계에서는 전통적인 이미지 처리 기법을 사용하여 피부 이미지의 평가 및 분석 결과를 획득한다. 훈련데이터준비단계에서는 피부이미지 분석결과로부터 피부 샘플데이터를 추출하여 훈련데이터를 준비하였다. 그리고 인공신경망훈련단계에서는 이 훈련데이터를 사용하여 지능적으로 피부 이미지 유형을 예측하는 인공신경망 AnnSampleSkin을 단계별 고도화와 훈련을 통해 모델을 완성하였다. 피부이미지식별단계에서는 소셜미디어로부터 수집된 이미지에 대해 피부샘플을 추출하고, 훈련된 인공신경망 AnnSampleSkin의 이미지 유형 예측 결과들을 통합하여 최종 피부 이미지 유형을 지능적으로 식별한다. 본 논문에서 제안된 피부이미지식별 방법은 약 92% 이상의 높은 피부 이미지 식별 정확도를 나타내고 있고, 정형화된 피부 샘플 이미지 빅데이터를 제공할 수 있게 되었다. 추출된 피부샘플 세트는 피부 상태를 진단하고 관리하는데 매우 효율적이고 유용한 정형화된 피부 이미지 데이터로 사용될 것으로 기대된다.

추출용매에 따른 홍삼 및 흑삼의 산성다당체와 진세노사이드 함량 모니터링 (Use of extraction solvent method to monitor the concentrations of acidic polysaccharides and ginsenosides from red and black ginseng)

  • 이기동
    • 한국식품저장유통학회지
    • /
    • 제30권5호
    • /
    • pp.857-867
    • /
    • 2023
  • 본 연구에서는 홍삼과 흑삼의 기능성 성분 추출 극대화를 위해 추출 용액의 ethanol 농도와 추출 온도를 고려하여 추출 수율, 산성다당체 및 ginsenosides의 함량 변화를 반응표면분석법을 통해 모니터링해 보고 적정 추출조건을 찾아보았다. 홍삼 및 흑삼의 가용성 고형분 함량에 대한 모델식의 R2는 각각 0.9679(p<0.01), 0.8545(p<0.1)였다. 홍삼가용성 고형분의 최적 추출조건은 ethanol 농도 1.52%에서 67.27℃로 추출 시 그 함량이 5.29%였으며, 흑삼 가용성 고형분의 최적 추출조건은 ethanol 농도 3.12%에서 66.13℃로 추출 시 그 함량이 6.11%였다. 홍삼 및 흑삼의 산성다당체 함량에 대한 모델식의 R2는 각각 0.9251(p<0.05), 0.88379(p<0.1)였다. 홍삼의 산성다당체 최적 추출조건은 ethanol 농도 4.03%에서 69.61℃로 추출 시 그 함량이 1.86 mg/mL였다. 흑삼의 산성다당체 최적 추출조건은 ethanol 용액 농도 24.67%에서 71.14℃로 추출 시 그 함량이 1.80 mg/mL였다. 홍삼의 ginsenoside Rg1 및 Rb1 함량에 대한 모델식의 R2는 각각 0.8941(p<0.05), 0.8718(p<0.1)이었다. 홍삼의 ginsenosides 최적 추출조건은 ethanol 농도 79.92%에서 70.62℃로 추출 시 ginsenoside Rg1 함량이 0.22 mg/mL였으며, ethanol 농도 79.94%에서 69.46℃에서 ginsenoside Rb1 함량이 0.36 mg/mL였다. 흑삼의 ginsenosides 최적 추출조건은 ethanol 농도 75.11%에서 65.21℃로 추출할 경우 ginsenoside Rb1 함량이 0.28 mg/mL였으며, ethanol 농도 75.70%에서 65.49℃에서 ginsenoside Rg3 함량이 0.31 mg/mL였다. 홍삼 및 흑삼의 산성다당체 수율과 ginsenoside 수율을 모두 만족하는 최적추출조건은 ethanol 농도 35-50%의 범위 내에서 70℃였다.

산업의 주식시장 선행성에 관한 실증분석 - 자산간 수익률 예측 가능성 - (A Study on Industries's Leading at the Stock Market in Korea - Gradual Diffusion of Information and Cross-Asset Return Predictability-)

  • 김종권
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2004년도 추계학술대회
    • /
    • pp.355-380
    • /
    • 2004
  • 이 논문은 과거의 산업 포트폴리오 수익률이 어떻게 확률추세(stochastic trend)로부터 전체 주식시장과 두 가지 거시경제 변수(경기동행지수와 산업생산)들을 예측할 수 있는 지를 알아보는 데에 초점을 두고 있다. 먼저, 산업들의 포트폴리오 수익률과 전체 주식시장 수익률이 VAR모형을 토대로 볼 경우 Granger 인과관계를 갖고 있는지를 살펴보았다. 이 분석의 결과에서 건설, 금속, 무역, 반도체, 보험, 비금속광물, 서비스, 섬유, 식료, 운수/창고, 유통, 의류, 자동차부풀, 전기전자, 정유, 조선, 종이/목재, 증권, 컴퓨터, 통신, 화학 등 21개 업종은 각 산업별 포트폴리오 수익률이 전체 주식시장 수익률을 $5\%$ 수준에서 통계적으로 유의한 영향을 주고 있음을 알 수 있었다. 이들 21개의 산업별 포트폴리오 수익률은 경제적으로도 중요한 의미를 지니고 있다. 즉, 당월(t)의 비금속광물과 정유, 금속 포트폴리오 수익률 등은 다음 월(t+1)의 전체 주식시장 수익률과 음(-)의 상관관계를 갖고 있는 것을 알 수 있었다. 이는 역사적인 데이터를 살펴볼 때, 이들 산업 제품의 가격의 상승은 향후 경제에 악영향을 주기 때문인 것이다. 반면에, 의류 및 무역 등의 경우에는 반대로 이들 산업들의 포트폴리오 수익률이 전체 주식시장 수익률과 양의 상관관계를 나타내 이들 산업들에 있어서 높은 수익률은 향후 경제가 상승국면이 예상됨을 나타내어 주고 있다. 이와 같은 산업별 포트폴리오 수익률과 거시경제변수 간의 높은 상관관계를 토대로 하여 전체 주식시장 수익률 예측을 가능하게 하는 업종 정보(sector information)의 점진적 확산(slow diffusion) 현상이 발생하게 되는 것이다.수 있었다.의 20세 이하 골절 및 탈구가$30.3\%까지 감소하게되어 년도가 증가함에 따라 청장년 층에 비하여 소아골절 및 탈구가 전체적으로 감소하는 경향을 보였다. 스키골절의 부위별 발생빈도는 1990년 이전까지 하지골절 및 탈구가 많았으나 이후 점차 상지의 골절 탈구가 증가하였다 하지에서 가장 많은 골절은 경골 골절이었으며, 경골골절은 회전력에 의한 나선형골절이 $76.5\%로 가장 많았고 년도에 따른 변화는 보이지 않았다. 스키손상의 발생빈도는 초기에 비하여 점차 감소하는 경향을 보였으며, 손상의 특성도 부위별, 연령별로 다양한 변화를 나타내었다.해가능성을 가진 균이 상당수 검출되므로 원료의 수송, 김치의 제조 및 유통과정에서 병원균에 대한 오염방지에 유의하여야 할 것이다. 확인할 수 있었다. 이상의 결과에 의하면 고농도의 유기물이 함유된 음식물쓰레기는 Hybrid Anaerobic Reactor (HAR)를 이용하여 HRT 30일 정도에서 충분히 직접 혐기성처리가 가능하며, 이때 발생된 $CH_{4}$를 회수하여 이용하면 대체에너지원으로 활용 가치가 높은 것으로 판단된다./207), $99.2\%$(238/240), $98.5\%$(133/135) 및 $100\%$ (313)였다. 각각 두 개의 요골동맥과 우내흉동맥에서 부분협착이나 경쟁혈류가 관찰되었다. 결론: 동맥 도관만을 이용한 Off pump CABG를 시행하여 감염의 위험성을 증가시키지 않으면서 영구적인 신경학적 합병증을 일으키지 않았고 좋은 혈관 개존율을 보여주었다. 따라서 동맥 도관을 이용한 Off pump CABG는 관상동맥의 협착의 정도에

  • PDF

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

개인정보보호 분야의 연구자 네트워크와 성과 평가 프레임워크: 소셜 네트워크 분석을 중심으로 (The Framework of Research Network and Performance Evaluation on Personal Information Security: Social Network Analysis Perspective)

  • 김민수;최재원;김현진
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.177-193
    • /
    • 2014
  • 개인정보 분야에서의 다양한 정보 보안 이슈가 발생함에 따라 해당 분야의 전문가를 확인하기 위한 프레임워크는 매우 중요한 영역이 되었다. 전문가 탐색과정은 주로 연구 업적 등을 통한 주관적인 평가가 일반적이지만 보다 객관적인 방식을 통한 선정이 매우 중요하다. 소셜 네트워크 분석기법의 응용이 다양한 영역에서 활용됨에 따라 본 연구는 개인정보보호분야의 전문가를 확인하고 해당 전문가들의 연구실적을 판단하기 위한 분석 프레임워크를 제시하고자 하였다. 본 연구는 연구 목적에 따라 개인정보보호 연구영역의 연구성과 자료를 바탕으로 소셜 네트워크 분석을 실시하고 핵심연구자의 성과를 분석하였다. 수집된 데이터는 연구의 공저자, 발행기관, 소속기관 등의 네트워크 구성에 활용되어 핵심전문가 집단을 관리하기 위한 프레임워크를 제시하였다. 본 연구는 NDSL에서 최근 5년 동안 발표된 논문들을 중심으로 자료를 수집하였다. 연구자들이 학술 정보를 교환하는 정기 간행물인 학술지를 바탕으로 연구 네트워크를 형성하는 네트워크 자료를 수집함으로써 연구활동에 대한 정보를 분석할 수 있었다. 일반적으로 연구자들은 연구 결과를 논문으로 발표하고, 발표된 논문들이 다수의 관련 분야 전문가들에게 공유된다는 점에서 학술연구지는 연구자들의 지식관련 의사소통 공간이며 지식의 구조화에 핵심적인 역할을 수행한다. 그에 따라 본 연구의 연구 대상 분야로 설정한 개인정보보호 분야의 연구 구조를 이해하기 위해 국내에서 발표된 관련 분야의 논문들을 연구 대상으로 자료가 수집되었다. 특히 자료의 선별 기준은 국내 최대의 데이터베이스를 보유하고 있는 NDSL에서 개인정보보호 관련 키워드를 보유한 논문 데이터를 수집 및 정제하여 분석 자료로 사용하였다. 2005년부터 2013년까지 약 2,000개의 연구결과 중 주제 관련성, 공저자 추출 등을 수집하였다. 데이터 수집 이후 연구 분석을 위한 데이터 처리를 통하여 통해 총 784개의 논문을 선정하고 분석대상으로 확정하였다. 분석 결과, 개인정보보호 연구영역의 전문가 집단을 이용한 연구논문 성과에 대한 분석은 핵심 연구자들을 추출해내고 전문가 집단을 관리하는 데 도움을 제공할 수 있다. 특히 소속집단 및 연구논문 발행기관을 분석함으로써 개인정보보호 연구영역에서 확인되지 않았던 연구자들의 연구 논문 게재의 공저자 네트워크가 매우 밀접함을 확인할 수 있다. 또한 연구논문의 발행기관 및 소속집단의 특성을 추출함으로써 개인정보보호 영역의 전문가 평가지표로서 소셜 네트워크 지표들의 활용가능성을 확인하였다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).