• 제목/요약/키워드: 자동 수집

검색결과 1,082건 처리시간 0.026초

전자의무기록 표준화 용어 관리 프로세스 정립 (Standardization and Management of Interface Terminology regarding Chief Complaints, Diagnoses and Procedures for Electronic Medical Records: Experiences of a Four-hospital Consortium)

  • 강재은;김기동;이영애;유수영;이호영;홍경란;황우연
    • 한국산학기술학회논문지
    • /
    • 제22권3호
    • /
    • pp.679-687
    • /
    • 2021
  • 전자의무기록 작성 시 주호소, 진단, 수술(처치) 용어는 작성자가 자유롭게 작성하는 것보다 시스템에 등재된 용어 마스터를 사용해야 의료진간의 의사소통이 원활하고, 데이터 활용을 위한 자료 추출이 가능하므로, 용어 마스터의 관리가 중요하다. 본 연구의 목적은 서울대학교 산하 4개병원(서울대학교병원, 분당서울대학교병원, 서울특별시 보라매 병원, 헬스케어시스템 강남센터)에서 개별적으로 운영하던 용어 마스터를 통합하여 표준화 및 관리 프로세스를 확립한 경험을 제시하는 것이다. 산하 4개 병원의 대표자로 구성된 서울대학교병원 용어표준화위원회는 여러 번의 논의를 거쳐 2016년 표준화 및 관리 프로세스를 확립하였고, 용어 마스터에 대한 요청을 신규 용어 등재, 용어 수정, 기존 용어 삭제와 신규 용어 등재, 그리고 용어 삭제의 4가지로 분류하였다. 요청에 대한 수용 여부는 유관 부서의 의견 조회와 그 결과를 검토한 서울대학교병원 용어표준화위원회의 의결로 결정하였다. 의결 정족수는 7명의 위원 중 5명이였으며, 참조 용어 체계에 대한 매핑은 3명의 보건의료정보관리사가 독립적으로 시행 후 이견이 있을 경우 합의하였다. 모든 과정은 온라인으로 시행하였고, 의결과 매핑 결과는 자동으로 수집되었다. 이러한 과정을 통해, 용어표준화위원회는 시스템에 등재될 용어에 대해 빠르고 명확한 의사결정을 할 수 있었고, 사용자들이 용어표준화위원회의 결정에 동의하도록 할 수 있었다. 프로세스가 정립된 후 16개월 간 126개의 신규 용어 등재, 131개의 용어 수정, 40개의 기존 용어 삭제와 신규 용어 등재, 그리고 1235개의 용어 삭제 가 처리되었다. 본 연구는 의료정보 시스템에 등재된 용어 마스터의 관리 프로세스를 정립한 최초의 시도라는 데 의의가 있다.

BERTopic을 활용한 불면증 소셜 데이터 토픽 모델링 및 불면증 경향 문헌 딥러닝 자동분류 모델 구축 (Topic Modeling Insomnia Social Media Corpus using BERTopic and Building Automatic Deep Learning Classification Model)

  • 고영수;이수빈;차민정;김성덕;이주희;한지영;송민
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.111-129
    • /
    • 2022
  • 불면증은 최근 5년 새 환자가 20% 이상 증가하고 있는 현대 사회의 만성적인 질병이다. 수면이 부족할 경우 나타나는 개인 및 사회적 문제가 심각하고 불면증의 유발 요인이 복합적으로 작용하고 있어서 진단 및 치료가 중요한 질환이다. 본 연구는 자유롭게 의견을 표출하는 소셜 미디어 'Reddit'의 불면증 커뮤니티인 'insomnia'를 대상으로 5,699개의 데이터를 수집하였고 이를 국제수면장애분류 ICSD-3 기준과 정신의학과 전문의의 자문을 받은 가이드라인을 바탕으로 불면증 경향 문헌과 비경향 문헌으로 태깅하여 불면증 말뭉치를 구축하였다. 구축된 불면증 말뭉치를 학습데이터로 하여 5개의 딥러닝 언어모델(BERT, RoBERTa, ALBERT, ELECTRA, XLNet)을 훈련시켰고 성능 평가 결과 RoBERTa가 정확도, 정밀도, 재현율, F1점수에서 가장 높은 성능을 보였다. 불면증 소셜 데이터를 심층적으로 분석하기 위해 기존에 많이 사용되었던 LDA의 약점을 보완하며 새롭게 등장한 BERTopic 방법을 사용하여 토픽 모델링을 진행하였다. 계층적 클러스터링 분석 결과 8개의 주제군('부정적 감정', '조언 및 도움과 감사', '불면증 관련 질병', '수면제', '운동 및 식습관', '신체적 특징', '활동적 특징', '환경적 특징')을 확인할 수 있었다. 이용자들은 불면증 커뮤니티에서 부정 감정을 표현하고 도움과 조언을 구하는 모습을 보였다. 또한, 불면증과 관련된 질병들을 언급하고 수면제 사용에 대한 담론을 나누며 운동 및 식습관에 관한 관심을 표현하고 있었다. 발견된 불면증 관련 특징으로는 호흡, 임신, 심장 등의 신체적 특징과 좀비, 수면 경련, 그로기상태 등의 활동적 특징, 햇빛, 담요, 온도, 낮잠 등의 환경적 특징이 확인되었다.

댐 방류 의사결정지원을 위한 딥러닝 기법의 적용성 평가 (Application of deep learning method for decision making support of dam release operation)

  • 정성호;레수안히엔;김연수;최현구;이기하
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1095-1105
    • /
    • 2021
  • 기후변화에 따른 집중호우, 태풍 등의 발생빈도의 증가로 인하여 댐 운영의 고도화가 요구되고 있다. 일반적으로 댐 운영의 경우 강우예측, 강우-유출, 홍수추적 등 다양한 수리수문학적 요소들을 반영하여 수행되나 기 계획된 특정 규칙에 기반한 댐 운영 모형의 경우, 때때로 개별 모듈들의 불확실성과 복합적인 인자들로 인하여 댐의 방류량을 능동적으로 제어하는데 제약이 있을 수 있다. 본 연구는 남강댐 직하류 홍수피해 예방을 위하여 댐의 방류량 결정 등 효율적인 댐 운영을 지원하기 위해 딥러닝 기반 LSTM (Long Short-Term Memory) 모형을 구축하고, 선행시간별 댐직하류 수위예측 정확도를 분석하는 것을 목적으로 한다. LSTM 모형의 입력자료는 댐 운영에 사용되는 기초자료 및 하류 장대동 수위관측소의 수위 자료를 시 단위로 2009년부터 2021년 7월까지 수집하였다. 2009년부터 2018년 자료는 모형의 학습과 검증 및 2019년부터 2021년 7월 자료는 선행시간을 7개(1 h, 3 h, 6 h, 9 h, 12 h, 18 h, 24 h)로 구분하여 관측 수위와 예측 수위를 비교·분석하였다. 그 결과, 선행시간 1시간의 예측결과는 평균적으로 MAE가 0.01 m, RMSE가 0.015 m, NSE가 0.99 로 관측 수위에 매우 근접한 예측 결과를 나타내었다. 또한, 선행시간이 길어질수록 예측 정확도는 근소하게 감소하였지만, 관측 수위의 시간적 패턴을 유사하게 안정적으로 예측하는 것으로 분석되었다. 따라서 수리수문학적 비선형의 복잡한 자료간의 특징을 자동으로 추출하여 예측 자료를 생산하는 LSTM 모형은 댐 방류량 의사결정에 있어 활용이 가능할 것으로 판단된다.

단일위성영상 기반 도심지 건물변화탐지 방안 (Building Change Detection Methodology in Urban Area from Single Satellite Image)

  • 김승희;김태정
    • 대한원격탐사학회지
    • /
    • 제39권5_4호
    • /
    • pp.1097-1109
    • /
    • 2023
  • 도심지는 개별 건물단위의 소규모 변화가 빈번하게 발생하는 지역이다. 기 구축된 건물 데이터베이스는 그 활용도를 높이기 위해 도심지 내의 주기적인 갱신이 요구된다. 그러나 광범위한 도심지에 대한 건물 단위 변화를 관측하기에는 자료수집의 한계가 존재한다. 따라서 본 연구에서는 넓은 범위를 단일 영상으로 촬영 가능한 위성영상을 활용하여 건물변화 탐지와 건물 정보의 갱신 가능성을 확인하고자 한다. 이를 위해 먼저 건물 데이터베이스에서 제공하는 건물 모서리점의 3차원 좌표를 이용하여 위성영상에 건물 영역을 투영한다. 투영된 건물 영역을 다시 지붕 및 전면 영역으로 구분한다. 투영된 지붕영역의 화소값을 비교하여 건물높이 갱신, 건물멸실 등 건물변화 여부를 탐지한다. 건물높이 갱신은 영상에 투영된 지붕면이 실제 영상에서 관측되는 지붕면과 일치할 때까지 높이값을 조절하여 수행된다. 영상에 투영된 모습은 나타나나 관측되는 건물이 없는 경우 철거된 건물에 해당한다. 영상에서 관측되는 건물 중에서 지붕면과 전면영역이 투영되지 않은 건물은 신축 건물에 해당된다. 이러한 변화탐지 결과를 바탕으로 건물 데이터베이스를 높이갱신, 건물삭제 및 건물생성의 세가지 분류로 갱신한다. 제안된 방식은 인천지역을 촬영한 아리랑 3A호와 인천광역시 건물 데이터베이스를 사용하여 실험하였다. 입력 단일 위성영상을 이용하여 건물변화를 탐지하고, 갱신이 필요한 건물에 대해 건물 데이터베이스 편집 작업을 수행하였다. 갱신된 건물 정보를 검증하고자 이를 이용하여 다른 아리랑 3A호 영상에 건물영역을 투영하였다. 실험결과, 갱신된 건물정보로부터 투영된 건물영역은 영상에서 관측된 건물영역과 잘 일치하였다. 이를 통해서 단일 위성영상을 이용한 건물변화탐지 및 건물 데이터베이스 갱신 가능성을 확인하였다. 후속 연구로 제안방식의 자동처리기술 개발을 수행할 예정이다.

주요 혈관 근처의 췌장 또는 췌장 주위 병변에 대한 초음파 유도하 경피적 중심 바늘 생검의 안전성과 효율성 (Safety and Efficacy of Ultrasound-Guided Percutaneous Core Needle Biopsy of Pancreatic and Peripancreatic Lesions Adjacent to Critical Vessels)

  • 정선화;강현지;이효정;김진실;이정경
    • 대한영상의학회지
    • /
    • 제82권5호
    • /
    • pp.1207-1217
    • /
    • 2021
  • 목적 췌장 및 췌장 주위의 주요 혈관에 인접한 병변에 대하여 초음파 유도하 경피적 중심 바늘 생검(ultrasound-guided percutaneous core needle biopsy; 이하 USPCB)의 안전성과 효능을 평가하였다. 대상과 방법 10년 동안 췌장(n = 98), 간문맥 근처 췌장 주위(n = 34), 또는 췌장 갈고리돌기 부위와 십이지장 제3부분과 인접한 대동맥주위(n = 30) 병변에 대하여 USPCB를 시행받은 162명의 환자의 검사 결과를 수집하였다. 초음파 유도하18게이지 바늘을 가진 자동 생검 총을 사용하였고, USPCB 결과는 수술 결과 또는 추적 관찰 영상과 비교하였다. USPCB의 진단 정확도 및 주요 합병증 비율을 계산했으며, 성공적인 생검의 예측을 위한 요인이 무엇인지 단변량 및 다변량 분석을 사용하여 평가하였다. 결과 USPCB에서 조직 병리학 진단은 149명(92%) 환자에서 일치했다. 주요 합병증은 장간막 혈종 4건과 십이지장 벽내혈종 1건이 발생했다(3%). 성공적인 생검을 위한 요인으로는 위 또는 장관을 통과하는 경로보다는 경장간막 경로를 이용할수록, 초음파상 표적 및 생검 경로가 잘 보일수록 등이 포함되었다. 또한 결과적으로 생검에 성공한 경우 생검 횟수가 더 적었다. 결론 USPCB는 주요 혈관에 인접한 췌장 및 간문맥 근처 췌장 주위 병변 또는 췌장 갈고리돌기 부위나 십이지장 제3부분과 인접한 대동맥 주위 병변의 조직학적 진단을 위한 높은 정확도 및 낮은 합병증 비율을 나타냈다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).

사용자 리뷰의 평가기준 별 이슈 식별 방법론: 호텔 리뷰 사이트를 중심으로 (Methodology for Identifying Issues of User Reviews from the Perspective of Evaluation Criteria: Focus on a Hotel Information Site)

  • 변성호;이동훈;김남규
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.23-43
    • /
    • 2016
  • 최근 IT기술의 발전에 따라 많은 사람들이 자신들의 여가활동에 대한 경험을 공유하고 있으며, 역으로 다른 사람들의 여가활동에 대한 경험을 참고하여 더 나은 여가활동을 누릴 수 있는 기회를 얻게 되었다. 이러한 현상은 영화, 숙박, 음식, 여행 등 여가활동 전반에 걸쳐 나타나고 있으며, 그 중심에는 여가활동에 대한 정보를 요약하여 제공하는 수많은 사이트가 있다. 대부분의 여가활동 정보 사이트는 각 상품에 대한 평균 평점뿐만 아니라 상세 리뷰를 제공함으로써, 해당 상품을 구매하고자 하는 잠재고객의 의사결정을 지원하고 있다. 하지만 기존 대부분의 사이트는 한 단계의 평가기준에 따라 평점과 리뷰를 제공하기 때문에, 각 평가기준을 구성하는 세부요소에 대한 특징과 평가기준 별 주요 이슈를 파악하기 위해서는 상당히 많은 수의 리뷰를 직접 읽어야 한다는 불편이 따른다. 즉 사용자는 자신이 중요한 것으로 생각하는 평가기준에 대한 조건을 파악하기 위해, 많은 수의 리뷰를 하나하나 읽어보는 과정에서 많은 시간과 노력을 소비하게 된다. 예를 들어 호텔의 접근성, 객실, 서비스, 음식 등 한 단계의 평가기준만을 사용하여 평점과 리뷰를 제공하는 사이트의 경우, 접근성 중 특히 지하철역과의 거리, 객실 중 특히 욕실의 상태를 살펴보고자 하는 사용자에게 필요한 정보를 충분히 제공하지 못하게 된다. 따라서 본 연구에서는 기존 여가활동 정보 사이트의 한계, 즉 평가기준별로 입력된 리뷰를 신뢰하기 어렵다는 점과 평가기준을 구성하고 있는 세부 내용을 파악하기 어렵다는 점을 극복하기 위한 방안을 제시하고자 한다. 본 연구에서 제안하는 방법론은 사용자가 별도의 구분 없이 입력한 리뷰를 그 내용에 따라 평가기준별로 자동 분류하고, 각 평가 기준 별 주요 이슈를 요약하여 제공한다. 제안 방법론은 최근 텍스트 분석에 활발하게 사용되고 있는 토픽 모델링(Topic Modeling)에 기반을 두고 있으며, 각 리뷰를 하나의 문서 단위로 사용하는 것이 아니라 리뷰를 문장 단위로 끊어 개별 리뷰 유닛(Review Unit)으로 분해한 뒤, 평가기준별로 리뷰 유닛을 재구성하여 분석한다는 측면에서 기존의 토픽 모델링 기반 연구와 큰 차이가 있다고 할 수 있다. 본 논문에서는 제안 방법론을 실제 호텔 정보 사이트에서 수집한 423건의 리뷰 문서에 적용하여 6가지 평가기준에 대해 총 4,860건의 리뷰 유닛을 재구성하고, 이에 대한 분석 결과를 소개함으로써 제안 방법론의 유용성을 간접적으로 보인다.

CT 선량 측정 프로그램을 이용한 PET/CT 검사 환자의 예측 유효 선량의 분석 (Analysis of Patient Effective Dose in PET/CT; Using CT Dosimetry Programs)

  • 김정선;정우영;박승용
    • 핵의학기술
    • /
    • 제14권2호
    • /
    • pp.77-82
    • /
    • 2010
  • PET/CT 기기의 설치가 증가함에 따라 PET/CT 검사 시감쇄 보정을 위한 CT 검사 역시 증가하여 검사 과정에서 피폭 선량이 증가 되고 있어 의료 피폭의 저감 대책을 포함한 방사선 안전 관리의 체계적인 구축이 필요하다. 본 연구에서는 PET/CT 검사에서의 환자 선량 데이터베이스를 구축하여 환자 선량 저감을 위한 초석을 세우기 위해 CT 선량 측정 프로그램을 사용하여 CT를 사용한 투과 스캔 시 환자가 받는 CT의 예측 유효 선량을 비교 분석하였다. BIO40, BIO16, DSTe8 에서 $^{18}F$-FDG PET/CT 검사를 시행한 180명을 대상으로 하였다. 각 기기 별로 남, 여 30명씩 선량의 평균을 분석하였다. 자동 노출 제어 시스템으로 선량 조절 시 가장 큰 영향을 줄 수 있는 환자의 체중 별로 50 kg미만, 50-60 kg 미만, 60 kg 이상 세 집단으로 나누어 선량의 평균을 분석하였다. CT-Expo v1.7과 ImPACT v1.0을 사용하여 선량 측정을 한 값을 비교 분석하고 체중과 유효 선량의 상관관계를 분석하였다. BIO40에서 검사한 환자의 유효 선량을 CT-Expo v1.7과 ImPACT v1.0을 사용하여 예측하였을 때, 남자 환자 30명은 각각 $6.46{\pm}1.18$ mSv, $6.54{\pm}1.21$ mSv, 여자 환자 30명은 각각 $6.29{\pm}0.97$ mSv, $5.87{\pm}1.09$ mSv 이었다. BIO16 에서 검사한 환자의 유효 선량은 남자 환자 30명은 각각 $9.36{\pm}1.96$ mSv, $8.36{\pm}1.69$ mSv 여자 환자 30명은 각각 $10.02{\pm}2.42$ mSv, $8.43{\pm}1.89$ mSv 이었다. DSTe8에서 검사한 환자의 유효 선량은 남자 환자 30명은 각각 $9.36{\pm}1.96$ mSv, $9.74{\pm}2.55$ mSv, 여자 환자 30명은 각각 $9.05{\pm}2.27$ mSv, $9.19{\pm}2.29$ mSv 이었다. 각 기기에서 검사를 시행한 환자의 체중에 따른 환자의 선량을 비교하기 위해, BIO40에서 검사를 시행한 환자를 대상으로 하여 50 kg 미만, 50~60 kg 미만, 60 kg 이상으로 체중별로 세 개의 집단으로 나누어 환자 선량을 측정하였다. CT-expo v1.7로 측정을 하였을 때 각각 $6.05{\pm}1.77$ mSv, $6.18{\pm}1.05$ mSv, $6.80{\pm}1.06$ mSv이었고 ImPACT v1.0으로 측정했을 때 각각 $5.06{\pm}1.46$ mSv, $5.72{\pm}0.86$ mSv, $6.42{\pm}0.96$ mSv이었다. BIO16에서 검사를 시행한 환자를 대상으로 하여 50 kg 미만, 50-60 kg 미만, 60 kg 이상으로 체중 별로 나누어 환자 선량을 측정하였다. CT-Expo v1.7로 측정을 하였을 때 각각 $7.74{\pm}0.66$ mSv, $8.58{\pm}0.93$ mSv, $10.88{\pm}1.32$ mSv이었고 ImPACT v1.0으로 측정했을 때 각각 $6.60{\pm}0.54$ mSv, $7.45{\pm}0.69$ mSv, $9.43{\pm}1.11$ mSv이었다. DSTe8에서 검사를 시행한 환자를 대상으로 하여 50 kg 미만, 50-60 kg 미만, 60kg 이상으로 체중 별로 나누어 환자 선량을 예측하였다. CT-Expo v1.7로 측정했을 때 각각 $5.03{\pm}0.95$ mSv, $8.25{\pm}1.66$ mSv, $10.33{\pm}1.68$ mSv 이었고 ImPACT v1.0으로 측정했을 때 각각 $5.20{\pm}1.01$ mSv, $8.51{\pm}1.53$ mSv, $10.9{\pm}1.87$ mSv이었다. 체중과 유효 선량의 상관관계를 분석하였을 때 CT-Expo v1.7과 ImPACT v1.0에서 Pearson 정률 상관계수가 각각 0.743, 0.692으로 매우 강한 양의 상관관계가 있었다. 피폭 선량의 예측이 필요할 경우 이와 같은 상용화된 선량 평가 프로그램을 사용하면 Phantom 연구를 시행하지 않더라도 유효 선량의 예측 및 평가가 가능하고, CT 선량 관리를 위한 기초 자료를 수집하는데 활용 될 수 있을 것으로 생각된다.

  • PDF

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.

종합 평점과 다기준 평점을 선택적으로 활용하는 협업필터링 기반 하이브리드 추천 시스템 (A Hybrid Recommender System based on Collaborative Filtering with Selective Use of Overall and Multicriteria Ratings)

  • 구민정;안현철
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.85-109
    • /
    • 2018
  • 추천시스템은 사용자의 과거 구매행동을 통해 향후 구매할 것이라고 예상되는 제품을 자동으로 검색하여 추천해준다. 특히 전자상거래 기업의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로 가치가 있다. 하지만, 전통적인 추천시스템, 특히 학계 및 산업계에서 가장 널리 사용되고 있는 전통적인 협업필터링 기법은 단일차원의 '종합 평점'만을 고려하여 추천결과를 생성하도록 설계되어 있어, 사용자들의 정확한 니즈를 이해하고 대응하는데 근본적인 한계가 있다. 최근에는 전자 상거래 기업들도 고객들로부터 보다 다각화된, 다기준 방식으로 피드백을 받고 있다. 특히 다기준 평점은 정량적으로 입력되는 정보이므로 상대적으로 분석 및 처리가 용이하다는 장점이 있다. 그러나 다기준 평점 역시 사전에 정해진 기준에 대해서만 사용자의 피드백이 이루어지기 때문에, 보다 상세하게 사용자의 의견을 이해하여 추천에 반영하는 데에는 한계가 있다. 이에 본 연구는 다기준 평점 정보와 선택적 협업필터링의 서로 다른 접근방법을 통해 도출된 추천결과를 종합하여, 최종적으로 추천 대상리스트를 산출할 수 있는 하이브리드 기술을 제안한다. 본 연구에서 제안한 연구모형의 유용성을 검증하기 위해, 식음료점(식당, 카페 등)에 대한 실제 이용자를 대상으로 온라인 설문을 통해 종합 평점과 다기준 평점을 수집하였으며, 데이터를 학습용과 검증용으로 구분하여 학습시키고 성과를 평가하였다. 이 기법은 결합 함수 기반 접근법과 사용자마다 구매의사결정의 체계가 다르다는 전제하에, 사용자들을 유형화하고, 유형에 따라 정보원을 선택적으로 활용하는 협업필터링 알고리즘을 활용했다. 실험결과, 제안 알고리즘을 통한 추천 방법이 단일 차원을 고려하는 전통적인 협업필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인했다. 아울러, 본 연구가 제안하는 다기준 평점과 선택적 협업필터링 알고리즘을 종합하여 추천하는 방법이, 단순히 다기준 평점을 고려했을 때 보다 통계적으로 유의한 수준의 정확도의 개선이 이루어짐을 확인할 수 있었다.