• 제목/요약/키워드: 리뷰데이터

검색결과 313건 처리시간 0.026초

통계적 기계학습에서의 ADMM 알고리즘의 활용 (ADMM algorithms in statistics and machine learning)

  • 최호식;최현집;박상언
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1229-1244
    • /
    • 2017
  • 최근 여러 분야에서 데이터에 근거한 분석방법론에 대한 수요가 증대됨에 따라 이를 처리할 수 있는 최적화 방법이 발전되고 있다. 특히 통계학과 기계학습 분야의 문제들에서 요구되는 다양한 제약 조건은 볼록 최적화 (convex optimization) 방법으로 해결할 수 있다. 본 논문에서 리뷰하는 alternating direction method of multipliers (ADMM) 알고리즘은 선형 제약 조건을 효과적으로 처리할 수 있으며, 합의 방식을 통해 병렬연산을 수행할 수 있어서 범용적인 표준 최적화 툴로 자리매김 되고 있다. ADMM은 원래의 문제보다 최적화가 쉬운 부분문제로 분할하고 이를 취합함으로써 복잡한 원 문제를 해결하는 방식의 근사알고리즘이다. 부드럽지 않거나 복합적인 (composite) 목적 함수를 최적화할 때 유용하며, 쌍대이론과 proximal 작용소 이론을 토대로 체계적으로 알고리즘을 구성할 수 있기 때문에 통계 및 기계학습 분야에서 폭 넓게 활용되고 있다. 본 논문에서는 최근 통계와 관련된 여러 분야에서 ADMM알고리즘의 활용도를 살펴보고자 하며 주요한 두 가지 주제에 중점을 두고자 한다. (1) 목적식의 분할 전략과 증강 라그랑지안 방법 및 쌍대문제의 설명과 (2) proximal 작용소의 역할이다. 알고리즘이 적용된 사례로, 별점화 함수 추정 등의 조정화 (regularization)를 활용한 방법론들을 소개한다. 모의 자료를 활용하여 lasso 문제의 최적화에 대한 실증결과를 제시한다.

Systematic analysis 방법을 이용한 국내 엽경채류 농산물의 미생물학적 오염도 분석 (Systematic Analysis of Microbial Contamination in Leaf and Stem Products in Korea)

  • 성승미;민지현;김현정;윤기선;이종경
    • 한국식품위생안전성학회지
    • /
    • 제32권4호
    • /
    • pp.306-313
    • /
    • 2017
  • 본 연구는 농산물의 미생물학적 수준에 관하여 체계적인 연구분석(systemic analysis) 기법을 이용하여 비가열 농산물의 위생안전관리를 목적으로 연구를 수행하였다. 2001년부터 2015년까지 인쇄된 관련 연구논문을 NDSL 검색엔진을 활용하여 자료를 수집, 리뷰, 자료 정리, 분석 및 결과 정리하였다. 농산물 분류체계를 비교 조사하여 미국의 IFSAC (Interagency Food Safety Analytics Collaboration)의 식품분류체계에 따라 국내 농산물을 분류하였다. 선정된 22건의 논문 내 89건의 데이터를 종합한 결과, 분류체계 내에서 국내 농산물에서 총균수 수준이 높고 대장균 오염이 가장 많은 농산물은 엽경채류와 새싹 발아채소(sprouts)로 나타났다. 단체급식에서 생채소로 소비되는 엽경채류에서 단체급식의 다소비 농산물로서 식중독과 연관성이 높은 품목인 상추, 부추, 배추에 관하여 미생물에 관한 자료 검색, 수집, 선정 및 분석 결과 최종 33편의 논문에서 미생물의 정량적 수준은 총균수 4.15~ 7.69 log CFU/g, 대장균군 1~6.99 log CFU/g, B. cereus 0.51~3.9 log CFU/g으로 나타났다. GAP 데이터 기반 농산물의 미생물학적 영향을 미치는 환경인자 문헌조사 결과 퇴비, 토양, 작업자 손, 장갑이 주요 영향인자로 나타났다. 농산물의 미생물학적 관리를 위하여 전문가 의견과 문헌조사를 통하여 GAP도입, 취약 품목의 미생물학적 분석계획, 토양으로부터 작물의 오염을 최소화 할 수 있는 작물생산방식 도입 및 실행규범 준수가 필요하다.

Impact of Word Embedding Methods on Performance of Sentiment Analysis with Machine Learning Techniques

  • Park, Hoyeon;Kim, Kyoung-jae
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.181-188
    • /
    • 2020
  • 본 연구에서는 다양한 워드 임베딩 기법이 감성분석의 성과에 미치는 영향을 확인하기 위한 비교연구를 제안한다. 감성분석은 자연어 처리를 사용하여 텍스트 문서에서 주관적인 정보를 식별하고 추출하는 오피니언 마이닝 기법 중 하나이며, 상품평이나 댓글의 감성을 분류하는데 사용될 수 있다. 감성은 긍정적이거나 부정적인 것으로 분류될 수 있기 때문에 일반적인 분류문제 중 하나로 생각할 수 있으며, 이의 분류를 위해서는 텍스트를 컴퓨터가 인식할 수 있는 언어로 변환하여야 한다. 따라서 단어나 문서와 같은 텍스트를 자연어 처리에서 벡터로 변형하여 진행하는데 이를 워드 임베딩이라고 한다. 워드 임베딩 기법은 Bag of Words, TF-IDF, Word2Vec 등 다양한 기법이 사용되고 있는데 지금까지 감성분석에 적합한 워드 임베딩 기법에 대한 연구는 많이 진행되지 않았다. 본 연구에서는 영화 리뷰의 감성분석을 위해 다양한 워드 임베딩 기법 중 Bag of Words, TF-IDF, Word2Vec을 사용하여 그 성과를 비교 분석한다. 분석에 사용할 연구용 데이터 셋은 텍스트 마이닝에서 많이 활용되고 있는 IMDB 데이터 셋을 사용하였다. 분석 결과, TF-IDF와 Bag of Words의 성과가 Word2Vec보다 우수한 것으로 나타났으며 TF-IDF는 Bag of Words보다 성과가 우수하였으나 그 차이가 매우 크지는 않았다.

체계적 분석 기법을 이용한 의미기반 이미지검색 분야 고찰에 관한 연구 (A Systematic Review on Concept-based Image Retrieval Research)

  • 정은경
    • 한국비블리아학회지
    • /
    • 제25권4호
    • /
    • pp.313-332
    • /
    • 2014
  • 디지털 기술과 인터넷의 발달로 인해 이미지 생산, 유통, 이용이 활발하게 이루어지고 있으며, 이미지 검색에 관한 연구도 증가하는 추세이다. 이미지검색 분야는 내용기반과 의미기반으로 나뉘어 연구가 수행되어왔으며, 문헌정보학 관점에서는 특히 의미기반의 색인과 검색에 주목해왔다. 본 연구는 체계적인 분석기법을 이용하여 의미기반 이미지검색 분야 연구 집적의 분석결과를 제시하고자 한다. 이를 위하여 데이터는 Web of Science 수록된 문헌정보학(Information Science/Library Science)분야의 이미지검색 논문 및 학술회의 논문 총 282건을 대상으로 하였으며, 국내 연구와 비교를 위해서는 DBpia에 수록된 문헌정보학 분야의 이미지검색 논문 35건을 수집하였다. 데이터 분석 과정은 우선 개괄적인 현황을 파악하기 위해서 서지사항을 분석하였고, 이와 함께 내용분석을 통한 체계적 분석 고찰을 수행하였다. 연구 결과 이미지 검색은 기존 연구에서 밝힌 바와 같이 의미기반 이미지 검색이 주된 흐름이며, 그 중에서도 이미지 색인과 기술 분야, 이미지 요구와 검색행태 분야의 연구가 주를 이루는 것으로 나타났다. 최근 연구 경향으로 주목할 만한 분야는 집합적 색인, 다언어/다문화 환경에서의 색인과 이미지 요구, 감정색인과 접근 등이다. 이용자 중심의 이미지 검색 연구 측면에서는 특정 이용자 그룹 중에서 대학생이나 대학원생이 주된 연구 대상 이용자 그룹이며 이 외에도 이미지를 업무에 사용하는 이용자 그룹에 대한 연구가 주된 경향이다. 최근에는 일반 이용자를 대상으로 일상생활 환경에서 이미지검색에 관한 연구가 등장하기 시작했다. 국내 연구와 비교하면, 논문의 수적인 차이를 제외하면 세부 연구 주제에 있어서 상당히 유사한 분포를 보이는 것으로 나타났다. 이러한 연구결과는 지금까지의 이미지 검색 분야의 연구 집적을 조명하며, 향후 발전적 방향을 제시하는데 있어서 도움이 될 것으로 기대한다.

국내학회지 논문 리뷰를 통한 원격탐사 분야 딥러닝 연구 동향 분석 (Analysis of Deep Learning Research Trends Applied to Remote Sensing through Paper Review of Korean Domestic Journals)

  • 이창희;윤예린;배세정;어양담;김창재;신상호;박소영;한유경
    • 한국측량학회지
    • /
    • 제39권6호
    • /
    • pp.437-456
    • /
    • 2021
  • 우리나라 원격탐사 분야에서는 2017년을 기점으로 딥러닝의 뛰어난 성능을 바탕으로 연구 성과를 나타내기 시작하여, 현재는 영상 전처리부터 활용까지 원격탐사의 거의 모든 분야에서 딥러닝을 적용하는 연구가 수행되고 있다. 원격탐사 분야에 적용된 딥러닝의 연구 동향 분석을 수행하기 위해, 2021년 10월까지 출판된 원격탐사 분야에 딥러닝이 적용된 국내 논문들을 수집하였다. 수집된 60여 편의 논문들을 바탕으로 딥러닝 네트워크 목적, 원격탐사 활용 분야, 원격탐사 영상 취득 탑재체별로 나누어 연구 동향 분석을 수행하였다. 또한, 논문에서 훈련자료 구축에 효과적으로 이용되었던 오픈소스데이터들을 정리하였다. 본 논문을 통해 현시점에서 딥러닝이 원격탐사 분야에 자리잡기 위해 해결해야 할 문제점들을 제시하면서, 향후 연구자들의 원격탐사 분야에 딥러닝 기술을 접목하기 위한 연구 방향을 설정하는 데 도움을 제공하고자 한다.

정부의 기술혁신 재정지원 정책효과에 대한 체계적 문헌연구 (Systemic literature review on the impact of government financial support on innovation in private firms)

  • 안준모
    • 기술혁신연구
    • /
    • 제30권1호
    • /
    • pp.57-104
    • /
    • 2022
  • 정부는 시장실패 방지, 정보의 비대칭성 완화, 자원의 효율적 배분 등 다양한 목적을 가지고 시장에 개입하여 민간기업의 기술혁신을 지원해 왔다. 2000년대 들어 국가 연구개발 예산이 급격히 증가하면서 기업에게 지원되는 정부재원도 비례하여 증가해왔으나 정부의 재정지원이 효과적이고 바람직한 정책목표를 달성했는지에 대해서는 분명하지 않다. 본 연구는 이러한 문제인식 하에 국내·외 관련 논문과 정책연구 보고서, 리뷰 페이퍼 등을 종합적·체계적으로 분석하여 다양한 정부 재정지원에 대한 문제점을 살펴보고자 하였다. 국·내외 총 168편의 연구를 체계적 문헌분석과 컨텐츠 분석을 활용하여 정책 부가성, 지원방식, 기업규모, 분석단위(unit of analysis), 분석대상, 연구방법론과 데이터 등 다양한 관점에서 입체적으로 분석하였다. 문헌 간 교차 비교를 통해 다수의 중복 수혜, 재정지원과 정책효과 간의 구조적 시차, 재정지원 효과의 비선형성, 정책간의 간섭과 교호작용, 폐쇄형 혁신과 제조업에 최적화된 조세제도 등이 현재 정부 재정지원의 문제점으로 분석되었으며, 이를 해결하기 위한 정책개선 방향으로 행동 부가성을 고려한 재정지원사업 성과지표 개발, 정부부처 간 정책협력과 조율 강화, 다양한 상황을 고려할 수 있는 정책혼합(policy mix) 도입, 디지털 혁신·서비스 연구개발 등 새로운 형태의 기술혁신에 맞는 기업 재정지원 방식, 데이터에 기반 한 증거기반 정책강화 등을 제시하였다.

알파인 스키 분석을 위한 운동역학 연구 동향 (Biomechanical Research Trends for Alpine Ski Analysis)

  • 이주성;문제헌;김진해;황지니;김혜영
    • 한국체육학회지인문사회과학편
    • /
    • 제57권6호
    • /
    • pp.293-308
    • /
    • 2018
  • 본 연구는 알파인 스키와 관련하여 과거부터 최근까지 진행된 운동역학 연구의 동향을 파악하여 향후 운동역학 분야에서 진행되어야 할 연구 방향을 제언하고자 수행하였다. 운동역학 연구 분야에서는 스키 턴의 메커니즘과 스키어의 등급과 기술 수준에 따른 자세 분석, 스키와 눈의 마찰력, 공기저항 등의 연구가 주로 진행되었다. 이후 측정 센서와 컴퓨터 시뮬레이션을 활용한 연구에서는 IMU와 GPS 센서를 활용하여 스키 장비 개발 및 획득 데이터 검증에 연구가 진행되고 있다. 이와 같은 연구동향을 반영하여 추후 알파인 스키 분야에서 진행되어야 할 운동역학 연구에 대한 제언은 다음과 같다. 첫째, 기존 운동역학 분석 범위의 한계를 넘어 스키 전 구간이 분석 가능하고 스포츠 현장에서 간편하게 활용할 수 있는 측정 장비가 개발되어야 한다. 둘째, 측정 센서를 활용하여 획득한 정보의 정확도 향상과 이를 바탕으로 다양한 분석기법에 관한 연구가 지속적으로 진행되어 스포츠 현장에 도움이 될 수 있는 자료가 제공되어야 한다. 셋째, 컴퓨터 시뮬레이션을 활용하여 스키에서 발생하는 부상 메커니즘을 명확히 정립하고 부상을 예방할 수 있는 방안을 모색해야 한다. 넷째, 컴퓨터 시뮬레이션을 활용한 3차원 스키 모델을 개발하여 실제 주행데이터와 비교 검증함으로써 최적화된 스키 궤적 알고리즘 제공이 필요하다.

담수 유해남조 세포수·대사물질 농도 예측을 위한 머신러닝과 딥러닝 모델링 연구동향: 알고리즘, 입력변수 및 학습 데이터 수 비교 (Machine- and Deep Learning Modelling Trends for Predicting Harmful Cyanobacterial Cells and Associated Metabolites Concentration in Inland Freshwaters: Comparison of Algorithms, Input Variables, and Learning Data Number)

  • 박용은;김진휘;이한규;변서현;황순진;신재기
    • 생태와환경
    • /
    • 제56권3호
    • /
    • pp.268-279
    • /
    • 2023
  • 근래에 들어, 머신러닝과 딥러닝 모델은 다양한 수체 내 수질변화를 예측하기 위해 광범위하게 사용되고 있다. 특히, 담수호의 물 이용과 수생태계 건강성에 위협 요인으로 작용할 수 있는 유해남조의 발생을 예측하기 위해 많은 연구자들이 인공지능 모델을 활용하고 있다. 따라서, 본 연구에서는 최근까지 유해남조의 발생을 예측하기 위해 적용된 인공지능 모델링의 선행 연구들을 검토하였고, 딥러닝을 포함하여 머신러닝 모델을 이용한 이 분야 연구의 발전방향을 모색하고자 하였다. 먼저, Elsevier의 초록 인용 데이터베이스인 Scopus를 활용하여 체계적인 문헌 연구를 수행하였다. 주요 키워드를 이용하여 탐색 및 정리된 문헌들을 리뷰한 결과, 딥러닝 모델은 주로 남조 세포수 예측에만 사용되었고, 머신러닝 모델은 남조 세포수 이외에 microcystin, geosmin, 2-MIB와 같은 대사물질 예측에도 초점을 맞추고 있었다. 또한, 남조 세포수와 대사물질의 예측을 위해 활용된 입력변수들은 현저한 차이가 있었다. 남조의 대사물질을 예측하기 위해 딥러닝 모델이 적용된 바가 없었는데, 향후 빅데이터 구축을 통한 대사물질을 예측하는 연구가 필요할 것으로 사료된다.

이미지 객체 및 메타정보 기반 GPT 활용 SNS 문장 작성 보조 시스템 (GPT-enabled SNS Sentence writing support system Based on Image Object and Meta Information)

  • 이동희;문미경;최봉준
    • 융합신호처리학회논문지
    • /
    • 제24권3호
    • /
    • pp.160-165
    • /
    • 2023
  • 본 연구에서는 SNS와 같이 이미지와 함께 글을 작성하는 활동을 보조하기 위해 YOLO와 GPT를 활용한 SNS 문장 작성 보조 시스템을 제안한다. YOLO 모델을 활용하여 글 작성 시 삽입되는 이미지에서 객체를 추출하고 메타정보인 GPS 정보, 생성 시간 정보도 추출하여 함께 GPT의 프롬프트 값으로 사용한다. YOLO 모델을 사용하기 위해 양식 이미지 데이터로 학습하여 사용했으며 해당 모델의 mAP score는 평균 약 0.25이다. GPT는 '맛집 리뷰' 주제의 1,000개의 블로그 텍스트 데이터를 학습하였으며, 본 연구에서 학습된 모델을 사용하여 이미지에서 추출한 2가지 타입의 키워드로 문장을 생성하였다. 생성된 문장의 실용성을 평가하기 위해 설문을 진행하였으며 설문 결과의 명확한 분석을 위해 폐쇄형 설문을 진행하였다. 삽입한 이미지와 키워드 문장을 제공하여 질문에 대해 3가지 평가 항목을 두어 진행하였다. 설문 결과 이미지의 핵심 키워드 경우 유의미한 문장을 생성한다는 결과를 얻을 수 있었다. 본 연구를 통해서 이미지 기반 문장 생성 시 이미지 키워드와 GPT 학습 내용과의 관계에 따라 결과물의 정확성이 달라진다는 결과를 얻을 수 있었다.

텍스트 마이닝 기반 사용자 경험 분석 및 관리: 스마트 스피커 사례 (User Experience Analysis and Management Based on Text Mining: A Smart Speaker Case)

  • 연다인;박가연;김희웅
    • 경영정보학연구
    • /
    • 제22권2호
    • /
    • pp.77-99
    • /
    • 2020
  • 스마트 스피커는 인공지능을 활용하여 음악, 일정, 날씨, 상품 등 다양한 정보와 콘텐츠들을 검색, 이용할 수 있는 대화형 음성 기반 서비스를 제공하는 기기이다. 인공지능 기술은 데이터가 축적될수록 이를 활용하여 더욱 정교하고 최적화된 서비스를 이용자에게 제공한다. 따라서 스마트 스피커 제조사들은 초기에 공격적인 마케팅을 통해 플랫폼 구축에 힘썼다. 하지만 스마트 스피커의 사용빈도는 월 1회 미만이 전체의 3분의 1 이상을 차지하고, 사용자 만족도도 49%에 그치는 것으로 나타났다. 이에 지속적인 이용활성화와 만족도 증진을 위해 스마트 스피커의 사용자 경험을 강화할 필요성이 대두되었다. 이에 본 연구에서는 스마트 스피커의 사용자 경험을 분석하고, 이를 바탕으로 스마트 스피커의 사용자 경험 강화 방안을 제시하고자 한다. 본 연구는 사용자가 직접 작성한 실제 리뷰 데이터를 수집하여 스마트 스피커 사용자 경험 차원을 기반으로 분석 결과를 해석했다는 점에서 의의가 있다. 또한 스마트 스피커 사용자 경험 차원을 개발하여 텍스트 마이닝 결과를 해석한 것에서 학술적 의의가 있다. 본 연구 결과를 통해 스마트 스피커 제조사에게 실무적으로 사용자 경험 강화를 위한 전략을 제안할 수 있다.