• 제목/요약/키워드: 텍스트수준

검색결과 268건 처리시간 0.024초

EPC 프로젝트의 위험 관리를 위한 ITB 문서 조항 분류 모델 연구: 딥러닝 기반 PLM 앙상블 기법 활용 (Research on ITB Contract Terms Classification Model for Risk Management in EPC Projects: Deep Learning-Based PLM Ensemble Techniques)

  • 이현상;이원석;조보근;이희준;오상진;유상우;남마루;이현식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.471-480
    • /
    • 2023
  • 국내 건설수주 규모는 2013년 91.3조원에서 2021년 총 212조원으로 특히 민간부문에서 크게 성장하였다. 국내외 시장 규모가 성장하면서, EPC(Engineering, Procurement, Construction) 프로젝트의 규모와 복잡성이 더욱 증가되고, 이에 프로젝트 관리 및 ITB(Invitation to Bid) 문서의 위험 관리가 중요한 이슈가 되고 있다. EPC 프로젝트 발주 이후 입찰 절차에서 실제 건설 회사에게 부여되는 대응 시간은 한정적일 뿐만 아니라, 인력 및 비용의 문제로 ITB 문서 계약 조항의 모든 리스크를 검토하는데 매우 어려움이 있다. 기존 연구에서는 이와 같은 문제를 해결하고자 EPC 계약 문서의 위험 조항을 범주화하고, 이를 AI 기반으로 탐지하려는 시도가 있었으나, 이는 레이블링 데이터 활용의 한계와 클래스 불균형과 같은 데이터 측면의 문제로 실무에서 활용할 수 있는 수준의 지원 시스템으로 활용하기 어려운 상황이다. 따라서 본 연구는 기존 연구와 같이 위험 조항 자체를 정의하고 분류하는 것이 아니라, FIDIC Yellow 2017(국제 컨설팅엔지니어링 연맹 표준 계약 조건) 기준 계약 조항을 세부적으로 분류할 수 있는 AI 모델을 개발하고자 한다. 프로젝트의 규모, 유형에 따라서 세부적으로 검토해야 하는 계약 조항이 다를 수 있기 때문에 이와 같은 다중 텍스트 분류 기능이 필요하다. 본 연구는 다중 텍스트 분류 모델의 성능 고도화를 위해서 최근 텍스트 데이터의 컨텍스트를 효율적으로 학습할 수 있는 ELECTRA PLM(Pre-trained Language Model)을 사전학습 단계부터 개발하고, 해당 모델의 성능을 검증하기 위해서 총 4단계 실험을 진행했다. 실험 결과, 자체 개발한 ITB-ELECTRA 모델 및 Legal-BERT의 앙상블 버전이 57개 계약 조항 분류에서 가중 평균 F1-Score 기준 76%로 가장 우수한 성능을 달성했다.

XML기반 전역 Peer-to-Peer 엔진 설계 및 구현 (Design and Implementation of XML based Global Peer-to-Peer Engine)

  • 권태숙;이일수;이승룡
    • 한국통신학회논문지
    • /
    • 제29권1B호
    • /
    • pp.73-85
    • /
    • 2004
  • 본 논문에서는 다양한 종류의 서비스 지원이 가능하며, PC, 웹, 모바일 환경을 연동 할 수 있는 새로운 개념의 XML 기반 글로벌 P2P 엔진을 제안하고 이에 대한 설계 및 구현 경험을 소개한다. 제안된 P2P 엔진은 모든 메시지 교환 시 텍스트 기반의 XML을 사용함으로써 웹 연동 및 이기종간 데이터 교환이 가능하며, 다중 수준의 보안레벨과 여러 보안 알고리즘을 적용할 수 있는 기능도 제공한다. 이를 위하여 제안된 시스템은 모든 메시지를 스케줄링, 필터링 하는 Message Dispatcher, 보안 기능을 지원하는 보안 관리자와 전송을 담당하는 전송 관리자를 포함하는 SecureNet Manager, 피어를 검색하여 피어 네트워크 환경을 구성하는 Discovery Manager, 그리고 XML 문서처리 기능을 포함하는 데이터 관리자인 Repository Manager 모듈로 구성되어있다. 본 논문에서 제안된 시스템의 가용성 평가를 위해 커뮤니케이션 서비스인 채팅과 협업 중 공동 저작 도구로서 화이트보드 그리고 파일 공유서비스를 각각 구현하고, 기존의 타 시스템과의 성능 비교 평가를 하였다.

어린이 그림책을 위한 주제명표 개발 연구: 『A to Zoo』를 바탕으로 (Developing Subject Headings for Children's Picture Books based on A to Zoo)

  • 박지영
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.251-271
    • /
    • 2012
  • 주제명은 이용자가 어린이 그림책을 효과적으로 접근하도록 지원한다. 그러나 어린이 그림책은 다른 자료에 비해 표제나 목차와 같이 자료 자체에서 주제명을 선정하기가 어렵다. 또한 텍스트 외에 그림이 주는 정보량이 큰 편이다. 따라서 그림책의 주제접근을 위해서는 별도의 주제명 목록을 작성할 필요가 있다. 그런데 어린이 그림책에 일반 도서용으로 개발된 주제명을 그대로 사용하기는 적절하지 않을 수 있다. 주제명의 유형과 수준이 상이할 수 있기 때문이다. 이에 본 연구에서는 어린이 그림책에 적합한 주제명표를 개발하고자 하였다. 기본 주제명의 선정을 위해서는 영미권에서 발행된 그림책 주제명표를 참고하였는데, 이 과정에서 우리 문화와 언어에 맞도록 기존의 표목을 수정 추가하였다. 또한 그림책의 주요 독자층인 어린이에게 적합한 표목을 선정하기 위해 초등국어사전과 같은 참고자료도 활용하였다. 그리고 시범적으로 구축된 주제명표를 어린이 그림책을 대상으로 한 권장도서 목록에 적용하여, 주제검색이나 브라우징, 도서 추천 등에 활용하는 방안을 제시하였다.

마이크로 블로그기반의 공간 지식 추출 기법연구 (A Technique for Extracting GeoSemantic Knowledge from Micro-blog)

  • 하수욱;남광우;류근호
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2012
  • 최근 ISO/TC211, OGC, INSPIRE 등 국제기구들을 중심으로 시맨틱 기술을 활용한 공간정보의 공유 노력이 진행되고 있다. 또한 스마트폰의 대중화와 소셜 네트워킹 서비스의 활성화로 인해 온라인 소셜 커뮤니티에서 이슈를 추출하기 위한 연구들이 이루어지고 있다. 그러나 응용 수준에서 가용한 공간정보 온톨로지는 부족한 실정이며, 소셜 네트워크 서비스에서의 공간정보 추출 역시 텍스트 마이닝을 통한 지오코딩 부분에 집중되어 있다. 따라서 소셜 미디어 정보에서 공간 현상을 추출하여 시맨틱 공간 지식으로 변환하기 위한 방법은 매우 유용하게 활용될 수 있다. 또한 공간 현상을 단순한 빈발 키워드가 아닌 연관 이슈의 형태로 사용자에게 제공함으로써 공간상에 발생하는 이슈에 대한 이해도를 향상 시킬 수 있을 것이다. 따라서 본 논문에서는 소셜 미디어 서비스의 하나인 마이크로 블로그를 기반으로 데이터를 수집하여 데이터 마이닝 기술을 접목하여 연관 이슈를 추출하고, 이를 시공간 지식으로 변환하기 위한 공간 이슈 온톨로지 모델을 제안하였다. 이를 통해 향후 관련 시스템의 개발을 위한 참조모델 및 공간 온톨로지 구축을 위한 모델로써 유용하게 사용될 수 있을 것으로 기대된다.

과학용어에 대한 '포털 사전', '표준국어대사전', '과학교과서' 설명의 비교 분석 (Comparison of the Explanation Texts for Science Terminology in Portal Dictionary, Pyojun Korean Dictionary and Science Textbooks)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제37권1호
    • /
    • pp.1-8
    • /
    • 2017
  • 학생들의 과학 학습 및 일반 대중의 과학적 소양 함양 측면에서 과학용어에 대한 이해도는 매우 중요하다. 본 연구에서는 학교 교육을 통한 과학용어 교육 이외에 학생들이나 일반 대중이 직접 과학용어의 의미를 찾아보고 학습할 수 있는 보조 자료가 필요하다는 전제에서 출발하여, 학생이나 일반인들이 스스로 과학용어를 학습하기 위한 보조 자료들인 포털사전, 표준국어대사전, 과학교과서에서 과학용어를 설명하는 글의 텍스트적 특성이 학생들이 읽고 이해하기에 얼마나 용이한지, 그리고 실제 학생들은 어떻게 인식하고 있는지를 살펴보았다. 그 결과 포털사전이나 표준국어대사전에 비해 과학교과서가 상대적으로 학생들이 읽고 이해하기에 쉬운 자료로 나타나기는 했으나, 세 자료 모두 학생들의 수준에 비해 이독성이 낮은 편에 속하며 이독성을 높이기 위해 개선해야 할 사항이 있는 것으로 나타났다.

의미 기반 정보 검색을 제공하는 멀티미디어 게시판 시스템 (A Multimedia Bulletin Board System Providing Semantic-based Searching)

  • 정의현
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.75-84
    • /
    • 2005
  • 게시판 시스템은 텍스트 외에도 다양한 멀티미디어 데이터를 포함하는 구조로 발전해왔다. 그러나 기존 시스템은 사용자가 게시물의 내용을 파악하기 위해서는 많은 시간과 노력을 들여야 한다는 단점을 갖고 있다. 이런 문제를 해결하기 위해 대부분의 게시판 시스템에서 검색 기능을 제공하지만, 렉시컬 수준의 정보 접근으로 사용자의 의도에 적합한 게시물을 찾는 것은 어려운 일이다. 더욱이 게시물이 멀티미디어를 포함하는 경우에는 검색이 거의 불가능하게 된다. 본 논문에서는 이를 해결하기 위하여 시맨틱 웹을 적용한 새로운 게시판 시스템을 제안한다. 제안된 게시판 시스템은 게시물의 분야와 멀티미디어 속성을 표현할 수 있는 온톨로지를 제공한다. 또한, 사용자들이 제안된 온톨로지로 분야별 게시판 온톨로지를 기술할 수 있도록 설계되었다. 시스템의 수정 없이 다양한 분야별 의미기반 검색을 제공하기 위하여, 관리자가 기술한 게시판 온톨로지를 게시판 시스템에서 도입할 경우 자동으로 입력/검색 인터페이스와 RDF 데이터의 접근 구조가 형성되도록 구현하였다. 제안된 게시판 시스템은 사용자의 의도에 적합한 게시물 검색을 하는 의미기반 검색의 가능성과 유효성을 보여주었다.

  • PDF

상황인지(Situated Cognition)원리를 적용한 효과적인 외국어 학습 방안 연구: MOO 학습환경을 중심으로 (Effective Foreign Language Learning with Situated Cognition in the MOO based Environments)

  • 이승희;서윤경
    • 정보교육학회논문지
    • /
    • 제6권1호
    • /
    • pp.64-74
    • /
    • 2002
  • 본 연구에서는 외국어 학습에서 상황인지(Situated Cognition)의 중요성을 탐색해 보고 상황인지 원리가 반영된 학습환경 중의 하나로 MOO(Multi-user Object Oriented)의 특성을 살펴보고자 하였다. 다른 분야에서도 그러하겠지만, 외국어 학습은 특히 학습해야 할 어휘 또는 표현법의 개념 이해를 넘어 이를 실제 활용할 수 있는 고차원적 수준으로 전개되어야 한다. 어린이가 실제 생활 속에서 주변 사람들과 상호작용하는 가운데 자연스럽게 모국어를 습득하듯이, 상황적 맥락이 충분히 제시되는 환경 속에서 외국어를 학습해야 이를 실제상황에서 십분 적용할 수 있는 가능성이 높아지는 것이다. 바로 이런 점에서 상황인지의 교육적 의의가 있다고 할 수 있다. 최근 교육 분야에서 관심을 모으고 있는 MOO는 텍스트 기반의 공간적 메타포(Spatial Metaphor)를 적용한 가상현실로서, 학습과정에 상황적 맥락을 제공하고 학습자의 상호작용을 촉진할 수 있다는 점에서 시사점이 매우 크다. 이에 본 연구에서는 MOO의 특성들을 활동중심, 맥락중심, 상호작용 측면에서 접근하여 외국어 학습환경으로서의 적용가능성을 제안하였다.

  • PDF

GNU 컴파일러를 이용한 ES-C2340 DSP2용 C 교차 컴파일러의 개발 (The Implementation of C Cross-Compiler for ES-C2340 DSP2 by Using the GNU Compiler)

  • 이시영;권육춘;유하영;한기천;김승호
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.255-269
    • /
    • 1997
  • 본 논문에서는 GNU 컴파일러를 이용하여 ES-C2340 DSP2 프로세서를 위한 C 교차 컴파일러를 개발한다. 신속하고 효율적인 컴파일러의 개발을 위해 언어 의존적인 프 론트 앤드(front-end)의 일부는 GNU 컴파일러를 사용하고, 프로세서 의존적인 백 앤 드(back-end)부분은 새로이 작성하여 결합하는 접근 방법을 사용한다. 이러한 접근 방법은 첫째, 프론트 앤드 부분에서 잘 검증된 GNU 컴파일러의 뛰어난 최적화 기법과 다중 언어 지원성을 사용하므로 컴파일러의 효율성과 범용성이 보장되고, 둘째, 하드 웨어 의존적인 부분의 구현에만 집중함으로써 개발 기간이 단축되며, 셋째 개발 시간 의 단축으로 인해 프로세서의 개발시에 논리 검증 도구로 고급 언어를 사용할 수 있 게 한다. 그리고 본 논문에서는 교차 컴파일러를 지원하기 위하여 텍스트 수준의 선 링커(pre-linker)도 구현한다.

  • PDF

WorldCat 수록 한국 및 일본 관련 청소년 책의 분석 (An Analysis on the Juvenile Books on Korea and Japan in the WorldCat)

  • 윤정옥
    • 한국문헌정보학회지
    • /
    • 제47권3호
    • /
    • pp.5-23
    • /
    • 2013
  • 이 연구의 목적은 WorldCat에 수록된 한국 및 일본 관련 청소년 책의 언어, 장르, 주제적 특성을 살펴보고, 소장도서관 및 보유 현황을 분석함으로써 한국과 일본 관련 지식 확산의 가능성을 전망하는 것이다. 이를 위해 1993년부터 2012년까지 발행된 청소년용 책의 서지레코드 및 이들 중 한국 및 일본 관련 책의 서지 레코드 수가 가장 비슷했던 1997년 발행 책들의 소장도서관 수, 언어, 장르 및 주제표목 분포를 상세히 계량분석 하였다. 한국 관련 책들은 WorldCat 수록 서지레코드 수가 절대적으로 적고, 1997년 책은 미국 내 소장 및 보유도서관 수가 적으며, 대부분 한글 전용 텍스트, 영유아 및 초등 저학년 수준 책의 과잉, 옛날이야기나 일화 중심 전기서 등 장르와 주제 편향성 등을 보여 '읽을거리'로서 흥미 유발이나 지식 확산의 전망이 제한적일 것으로 나타났다.

장애인의 웹 접근성 향상을 위한 웹사이트 설계 (Website Design for Improving Web Accessibility of Disabled People)

  • 이원경;서은경
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.193-219
    • /
    • 2013
  • 장애인들의 웹서비스 이용도와 의존도가 상당히 높아진 현실을 고려한다면 공공기관이나 도서관 웹사이트의 접근성을 극대화하기 위한 대책 마련이 시급한 실정이다. 본 연구는 장애인의 웹 접근성을 높이기 위하여 우선적으로 고려해야 하는 웹사이트 설계 지침을 제공하는데 그 목적이 있다. 이를 위하여 먼저 웹 표준 및 웹 접근성지침, 그리고 관련 최신 연구들이 제안한 웹 접근성 요건들을 기반으로 중요도 수준이 포함된 42개의 항목의 웹 접근성 요건 체크리스트를 구축하였고 다음으로 공공도서관을 포함한 15개의 공공기관 웹사이트의 접근성을 평가하였다. 그 결과, 중요하다고 고려된 요건들이 아직까지도 지켜지지 않고 있음을 파악할 수 있었다. 따라서 본 연구는 장애인의 웹 접근성을 향상시킬 수 있는 웹사이트 설계 지침을 콘텐츠구성, 소리, 색, 키보드접근, 마우스접근, 접근기능, 이미지, 텍스트처리, 코드처리 등 9개 분야별로 제안하였다. 이러한 제안은 향후 접근성 지침에 따른 웹사이트 제작의 가이드뿐만 아니라 장애인의 접근성 향상을 위한 자료로 활용될 수 있을 것이다.