• 제목/요약/키워드: text classification

검색결과 733건 처리시간 0.019초

공사일지의 텍스트 마이닝을 통한 우천 공기지연 리스크 정량화 (Quantification of Schedule Delay Risk of Rain via Text Mining of a Construction Log)

  • 박종호;조민건;엄세호;박선규
    • 대한토목학회논문집
    • /
    • 제43권1호
    • /
    • pp.109-117
    • /
    • 2023
  • 건설공사에서의 공기지연은 공사금액 증가, 발주처 클레임, 무리한 공기단축에 따른 건설공사의 질 하락 등 건설프로젝트에 악영향을 끼치는 주요 리스크 요인이다. 기존 연구에서는 공기지연 리스크의 중요도 및 우선순위를 파악하고 중요도에 따라 공정을 관리하였으나, 공기지연 리스크의 심도는 데이터 수집의 한계 등으로 정량화 연구가 미흡하다. 따라서 본 연구에서는 BERT (Bidirectional Encoder Representations from Transformers) 언어 모델을 활용하여 비정형데이터로 저장된 공사일지의 작업내용을 분석 가능한 WBS (Work Breakdown Structure) 기반의 정형데이터로 변환하고 리스크 분류 및 도출 체계, 공정계획에 사용가능한 리스크 발생확률, 리스크 확률분포(심도)의 정량화 방안을 제시하였다. 제안된 프로세스를 고속도로공사 8개 공구에 적용하여, 39개 세부 공중 중 8개의 세부 공종에서 75건의 우천 공기지연 리스크를 도출하였다. K-S 검정을 통해 4개 공종에서 유의미한 확률분포를 도출하였으며 위험도를 비교하였다. 향후 본 연구에서 제시된 프로세스는 시공단계에서 발생하는 다양한 공기지연 요인의 도출 및 심도 정량화에 적용될 수 있을 것으로 기대된다.

GNN을 이용한 웹사이트 Hierarchy 유사도 분석 기반 해외 침해 사이트 분류 모델 연구 (A Study on the Classification Model of Overseas Infringing Websites based on Web Hierarchy Similarity Analysis using GNN)

  • 서주현;유선모;박종화;박진주;이태진
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.47-54
    • /
    • 2023
  • 전 세계적으로 한류 콘텐츠가 유행하며 국내뿐만 아니라 해외에서도 국내 저작물의 저작권 침해 사례가 지속적으로 증가하고 있다. 이에 대응하기 위한 국내 불법 저작물 유통 사이트를 탐지하는 기술에 대한 연구가 활발하게 진행되고 있으며 최근 연구는 국내 불법 저작물 유통 사이트들이 광고 배너를 상당수 포함하고 있는 특징을 활용한 연구가 존재한다. 그러나 해외 불법 저작물 유통 사이트의 경우 광고 배너를 포함하지 않거나 국내 사이트에 비해 적은 양의 광고를 포함하고 있어 국내와 같은 탐지 기술의 적용이 제한적이다. 본 연구에서는 저작물 불법 공유 사이트가 게시물과 저작물의 이미지를 유사한 계층 구조로 포함하는 특징을 이용하여 링크 트리 및 텍스트 유사도 비교 기반의 탐지 기술을 제안한다. 대량의 링크로 작성된 대규모 트리의 정확한 유사도 비교를 위해 GNN(Graph Neural Network)를 활용한다. 본 연구의 실험에서 일반 사이트와 저작물 불법 유통 사이트를 분류에 95% 이상의 높은 정확도를 보였고 해당 알고리즘을 적용하여 불법 유통 사이트의 자동화된 탐지를 통해 신속한 저작권 침해 대응이 가능할 것으로 기대된다.

인터넷 쇼핑 사이트에서 제품 정보 설계의 타당성 검토 (Feasibility Study of Product Information Design at Internet shopping sites)

  • 이주희
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.283-289
    • /
    • 2015
  • 본 연구는 인터넷 쇼핑몰의 제품 상세페이지에서 구매요인에 영향을 미치는 정보가 무엇인지 살펴보는 것이다. 이를 위해 첫 번째로, 인터넷쇼핑몰의 제품 정보와 구매 요인을 결정짓는 것이 무엇인지 이전 연구를 통하여 조사하였고, 두 번째는, 이것을 바탕으로 기초 설문지를 구성하였고, 마지막으로 가장 큰 영향을 미치는 각 인자의 유효성을 검증하고 시행하였다. 연구를 통해 소비자가 정말 원하는 정보는 무엇이고, 구매를 하게 하는 정보는 무엇인지 알아내어 인터넷 쇼핑 사이트 설계에 도움이 되고자 한다. 인터넷 쇼핑 사이트에서 사용자 리뷰, 사이트의 안정성, 사이트의 내부 구조, 제품의 보유 수, 활용 가능한 3D 이미지와 제품 이미지에서 사용자 후기와 상품 이미지가 상품 구매에 영향을 주는 인자로 확인되었다. 사이트 디자인에서 레이아웃, 컬러 시스템, 텍스트 등 많은 디자인 요소도 중요하지만, 제공하는 제품에 대한 충분한 정보에 의해 구매할 수 있도록 설계되어져야 할 것이다.

디지털 독서 및 정보 리터러시 평가 문항 분석을 통한 독서 및 정보 서비스의 방향 탐색 - PIAAC와 PISA를 중심으로 - (A Study on the Direction of Reading and Information Service through Analysis of Digital Reading and Information Literacy Competencies Evaluation Items: Focusing on PIAAC and PISA)

  • 박주현
    • 한국문헌정보학회지
    • /
    • 제52권3호
    • /
    • pp.61-89
    • /
    • 2018
  • 본 연구의 목적은 국제 성인 역량 평가(PIAAC)와 국제 학업성취도 평가(PISA)에서 측정된 디지털 독서 리터러시 및 디지털 정보 리터러시 문항의 측정 내용과 방법을 살펴보고 공공도서관의 사서와 초 중등학교의 사서교사가 독서 및 정보 서비스를 제공하는 데에 필요한 시사점을 도출하는 데 있다. 디지털 독서 리터러시나 디지털 정보 리터러시 측정 문항을 해결하기 위하여 응답자는 인지 전략과 더불어 ICT 기술 역량이 공통적으로 필요하였다. 다만 디지털 독서 리터러시 측정 문항에서는 텍스트를 종합적으로 이해하고 비판적으로 사고하는 능력이 강조되었으며 디지털 정보 리터러시 측정 문항에서는 ICT 활용 능력과 항해(navigation) 능력 및 검색된 텍스트를 읽을 것인지를 평가하는 능력이 강조되었다. 사서나 사서교사들은 이용자들의 독서를 더욱 권장할 필요가 있으며, 특정한 집단의 성취결과나 특성을 반영하여 맞춤형 역량 향상 프로그램을 제공할 필요가 있다. 또한 자료 검색시스템과 한국십진분류법에 대한 이해와 활용이 가능하도록 도서관 환경을 정비하고 개발할 필요가 있다.

생의학 분야 학술 문헌에서의 이벤트 추출을 위한 심층 학습 모델 구조 비교 분석 연구 (A Comparative Study on Deep Learning Topology for Event Extraction from Biomedical Literature)

  • 김선우;유석종;이민호;최성필
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.77-97
    • /
    • 2017
  • 최근 생의학 분야의 학술 문헌이 기하급수적으로 급증함에 따라 관련 분야 연구자들은 선행 연구 및 연구 동향 파악에 어려움을 겪고 있다. 이에 효율적인 선행 연구 및 연구 동향 파악을 위한 정보 추출 기술이 요구되며, 학술 문헌의 정보 추출을 위한 개체인식 및 개체 간의 생의학 이벤트 추출 연구가 활발히 진행되고 있다. 본 연구는 이에 심층 학습(Deep Learning)의 기법 중 하나인 컨볼루션 네트워크(Convolutional Neural Networks, CNN) 모델을 기반으로 이벤트 내의 개체 유형 정보의 적용 위치와 함께, 이벤트 식별 및 분류를 고려하여 총 8가지의 모델을 구성하여 실험하였다. 실험 결과, 본 연구에서 제안하는 모델 중 최고성능을 보인 개체 유형 완전연결 모델이 이벤트 분류 실험에서 F-점수 72.09%의 높은 성능을 보였으나, 이벤트 추출 실험에서는 학습 컬렉션의 불균형 문제 및 이벤트 식별 모델의 성능 저조 등으로 인하여 F-점수 21.81%의 비교적 저조한 성능을 보였다.

음료자동판매기의 그린디자인에 관한 연구 (A Study on the Green Design for a Drink Vending Machine)

  • 문금희
    • 디자인학연구
    • /
    • 18호
    • /
    • pp.177-186
    • /
    • 1996
  • 국민들의 생활수준 향상에 따른 생활패턴의 변화와 더불어 환경오염 문제가 날로 심각해져 가고 있다. 각종 폐기물의 급증으로 파괴되는 환경의 보전을 도모하기 이해 자원의 절약과 재활용 촉진이 불가피하게 되었다. 이러한 환경문제에 대한 인식과 더불어 국민들의 건강, 환경문제에 대한 인식이 점차 강화되고 무공해에 대한 갈망이 환경상품에 대한 욕구로 대체되어 환경소비주의를 대두시켰다. 음료자동판매기는 일회용 용기를 주로 사용하므로 환경문제와 밀접한 관계를 맺고 있고 따라서 그린디자인이 적용되어야만 하는 제품이다. 본 연구에서는 그린디자인의 배경 및 개념과 음료자동판매기의 분류, 구조 및 환경에 대해 조사하였다. 그것을 배경으로 하여 음료자동판매기의 그린디자인 전개방향에 대한 컨셉을 설정하였고 대안들을 분리수거형과 재사용형으로 선정하였다. 대안들을 다시 벽면부착형, 중앙설치형 및 데스크탑형의 셋 방향으로 포커스 모델을 제시하였다. 결론적으로 음료자동판매기의 디자인을 위해서는 환경 문제 해결을 위한 그린디자인, 사용 성을 높이기 위한 인간 공학적 배려와 주변환경과의 조화를 위한 조형이미지 등에 대한 연구가 필요하다.

  • PDF

인터넷을 통한 상호구축적 디자인 용어사전의 연구 (A Study on the Inter-constructive Design Dictionary through the Internet.)

  • 김태균
    • 디자인학연구
    • /
    • 제14권4호
    • /
    • pp.25-33
    • /
    • 2001
  • 인터넷 활용의 증가와 함께 디자이너 계층의 인터넷을 이용한 정보 접근력은 해마다 급증하고 있으며, 디자인을 학습하는 학생 및 전문가를 포함한 관련계층에게 디자인 공통용어와 개념을 빠르게 전달할 필요가 있다. 이를 위하여 인터넷은 유용한 매체임에 틀림없으나, 새로운 용어의 급격한 증가와 사용자 상호작용 요소를 감안하면 정보의 일방적 구축과 단방향적 전달만으로는 인터넷의 특성에 미흡하다 할 것이다. 이는 오프라인 서적을 통한 기존의 전달 방법과 달리 온라인 데이터베이스 구축 프로세스에 대한 심도 있는 고찰이 필요하고, 이를 바탕으로 한 적절한 인터페이스 구조의 연구가 필요함을 의미한다. 따라서 본 연구의 목적은 일방적 정보 전달 형식에서 벗어나 전체적 시스템 구축의 관점으로 실시간 자생적 정보 구축을 목표로 인터넷을 이용한 데이터베이스 모델을 제시하고자 한다. 즉 인터넷을 이용한 디자인 용어사전의 연구를 통해 가상공간 내에서 텍스트의 변형과 중심을 생산자에서 소비자로 옮기고, 수용자에 의한 생산과정에의 참여 모델을 제시함으로서, 고도의 개방성과 상호 텍스트성을 바탕으로 한 사용자 중심의 상호 구축적 교환체계로 변환하는 방안을 제안하고 구조화하였다

  • PDF

태극침법(太極鍼法)의 확장형인 오장원혈침법(五臟原穴鍼法)의 적응증 연구 - "황제내경(黃帝內經).영추(靈樞)"를 중심으로 - (A study on the indications of Five Viscera Source Point Acupuncture extended from Taegeuk Acupuncture : Focused on Yeoungchu(靈樞))

  • 모한영;임교민;백진웅
    • 대한한의학원전학회지
    • /
    • 제25권4호
    • /
    • pp.123-147
    • /
    • 2012
  • Objective : By establishing the Five Viscera Source Point Acupuncture as the targeted acupuncture treatment for stadardization, as the first step, this study was conducted to sort the indications of each acupuncture remedies, which can be referred as one of the most important factors in acupuncture treatment, based on Yeoungchu. Method : This study selected only the contents related to indications of five viscera, by extracting the relevant sentences from Yeoungchu using the search words Liver(Liver Meridian, First Yin), Heart(Pericardium, Heart Meridian, Second Yin), Spleen(Spleen meridian, Third Yin), Lung(Lung Meridian, Third Yin), and Kidney(Kidney Meridian, Second Yin). Result & Conclusion : 1. We selected and extracted text related to liver disease from Chapter 16, heart (pericardium) disease from Chapter 16, spleen disease from Chapter 19, lung disease from Chapter 17, and finally kidney disease from Chapter 17 of Yeoungchu. 2. The basic theory of applying Five Viscera Source Point Acupuncture to five viscera diseases is first assorting the diseases according to its state (i.e. deficiency or excess), then draining the source point of the appropriate viscus in case of excess, or supplementing the source point of the appropriate viscus in case of deficiency. 3. For the correct application of Five Viscera Source Point Acupuncture, the classification of the disease, not only the judgement on its state, must be presented systematically and synthetically in combination with Four Examinations. Therefore the follow-up studies needs to be conducted.

서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선 (Video character recognition improvement by support vector machines and regularized discriminant analysis)

  • 임수열;백장선;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.689-697
    • /
    • 2010
  • 본 연구에서는 비디오이미지로부터 추출된 텍스트영역으로부터 문자인식을 수행하였다. 비디오영상으로부터 추출된 문자열은 한글, 영어, 숫자, 특수문자 등으로 혼합되어 있거나, 또는 다양한 폰트와 크기, 그래픽 형태의 글자 존재, 영상의 기울어짐, 끊김, 잡영, 접촉, 저해상도의 글자 등으로 인하여 일반적인 문자인식에 비해 많은 어려움이 존재한다. 이와 같은 어려움을 극복하기위해 본 연구에서는 모든 글자에 대해서 인식하지 않고 가장 빈번하게 등장하는 글자만을 인식하고 나머지는 버리는 방법을 사용하였으며 지지도벡터기계와 정칙화판별분석의 2단계 문자인식 방법을 이용하여 인식률을 개선하였다. 또한 인식률이 좋지 못한 4형식과 5형식 글자에 대해 모음별로 중분류를 실시하였다. 실험결과 지지도벡터기계와 정칙화판별분석을 동시에 사용하는 방법이 다른 문자인식의 방법들보다 인식률이 우수하였으며, 부분적인 중분류의 방법을 이용한 경우 향상된 인식 성능을 나타냈다.

언어네트워크분석을 이용한 야외지질학습 전후의 퇴적암에 대한 개념 구조 변화 분석 (An Analysis of the Changes of High School Students' Conceptual Structure about Sedimentary Rocks before and after the Field Trip using the Semantic Network Analysis)

  • 박경진;정덕호;조규성
    • 한국지구과학회지
    • /
    • 제34권2호
    • /
    • pp.173-186
    • /
    • 2013
  • 본 연구의 목적은 언어네트워크분석을 이용하여 야외지질학습에서 학생들의 퇴적암에 대한 개념 구조 변화를 알아보기 위한 것이다. 이를 위하여 고등학생 15명을 대상으로 퇴적암에 대한 정의, 분류, 생성과정 및 특징을 묻는 개방형 문항을 개발하였으며, 이 텍스트 자료를 언어네트워크분석법을 통해 분석하였다. 그 결과 첫째, 야외지질학습을 통해 학생들의 퇴적암에 대한 개념 구조는 사전에 비해 사후에 크게 확장되었다. 둘째, 학생들의 개념 구조를 구성하는 하위 클러스터는 서로 긴밀하게 연결되어 있는 '작은 세상 네트워크'를 형성하였다. 셋째, 학생들의 개념 구조의 규모는 수개월이 지난 후 감소하였지만, 하위 클러스터의 연결 상태는 그대로 유지하고 있었다.