• 제목/요약/키워드: Document research

검색결과 1,342건 처리시간 0.025초

MBTI 조직성격유형화에 따른 기업분류: 기업리뷰 빅데이터를 활용하여 (Firm Classification based on MBTI Organizational Character Type: Using Firm Review Big Data)

  • 이한준;신동원;안병대
    • 아태비즈니스연구
    • /
    • 제12권3호
    • /
    • pp.361-378
    • /
    • 2021
  • Purpose - The purpose of this study is to classify KOSPI listed companies according to their organizational character type based on MBTI. Design/methodology/approach - This study collected 109,989 reviews from an online firm review website, Jobplanet. Using these reviews and the descriptions about organizational character, we conducted document similarity analysis. Doc2Vec technique was hired for the analysis. Findings - First, there are more companies belonging to Extraversion(E), Intuition(N), Feeling(F), and Judging(J) than Introversion(I), Sensing(S), Thinking(T), and Perceiving(P) as organizational character types of MBTI. Second, more companies have EJ and EP as the behavior type and NT and NF as the decision-making type. Third, the top-3 organizational character type of which firms have among 16 types are ENTJ, ENFP, and ENFJ. Finally, companies belonging to the same industry group were found to have similar organizational character. Research implications or Originality - This study provides a noble way to measure organizational character type using firm review big data and document similarity analysis technique. The research results can be practically used for firms in their organizational diagnosis and organizational management, and are meaningful as a basic study for various future studies to empirically analyze the impact of organizational character.

디지털도서관 구축과정에서 TREC 텍스트 문서의 시각적 표현에 관한 연구 (A Study on the Visual Representation of TREC Text Documents in the Construction of Digital Library)

  • 정기태;박일종
    • 정보관리학회지
    • /
    • 제21권3호
    • /
    • pp.1-14
    • /
    • 2004
  • 이용자들은 유사문서를 검색할 때, 각 가지 문서의 시각적표현을 통하여 도움을 얻게 되며, 모든 정보검색에 관한 연구는 이용자들의 다양한 요구를 충족시키기 위한 여러 가지의 해결책을 제시하고 있다. 제안되어진 해결책은 알파벳 순서로 만들어 진 파피루스 문서로부터 카드목록, 마이크로 필름을 이용한 저장, 컴퓨터 디스크를 이용한 파일 보관 등에 이르기까지 다양한 방법들을 들 수 있을 것이다. 또한 대부분의 정보검색 시스템들은 Document SUITogate( 문헌을 대체할 수 있는 것들 ), 즉 요약문, 목차, 초록, 리뷰한 내용, 기계가독형목록 (MARC) 기록물 등과 같은 서지자료들을 전체논문을 대체하여 이용하게 된다. 본 논문에서는 또 다른 형태의 Document Surrogate 로서 용어 리스트의 집단화 방법을 이용해서 찾아보았다. 이 Document Surrogate 들은 Multidimensional Scaling (MDS) 을 이용해서 2 차원 그래프 위에 좌표로써 표현되어지고 있다. 사용된 2차원의 그래프 위에서 좌표간의 거리는 문헌들의 유사성을 나타낸다고 해석할 수 있으며 거리가 가까우면 가까울수록 두 문서는 더욱 유사한내용을 포함하고 있다고 해석할 수 있는 것으로 밝혀졌다.

VR 환경에 최적화 된 문서 뷰어에 관한 연구 (A Study on the Document viewer optimized for VR environment)

  • 주용호;김상목;조옥희
    • 한국융합학회논문지
    • /
    • 제12권5호
    • /
    • pp.139-145
    • /
    • 2021
  • 우리는 본 연구를 통해 VR 환경에서 문서 뷰어가 본격적인 연구·개발과 상용화의 필요성이 있는지를 검증하기 위하여 사용자의 사용만족도를 연구하고자 한다. VR 콘텐츠는 사실적인 3D 그래픽과 360도 비디오로 구성되어 있으며, 공감각적인 경험과 몰입을 제공한다. 이러한 개념을 PDF나 PPT, Word, CAD 등의 문서를 보는 시스템으로도 활용할 수 있는 VR 문서뷰어 프로토 타입을 개발 및 테스트하였다. 사용자의 신체 인터랙션에 따라, 시야의 방향에 따라 인터랙티브한 뷰 환경을 제공하는 뷰어로써 작용할 수 있으며, 뷰어를 이용할 시 사용자의 높은 몰입도와 집중도를 이끌어낼 수 있는 것이 VR 문서뷰어의 특징이라고 할 수 있다. 개발된 프로토 타입을 100명의 VR 경험자 및 디바이스 소유자들로 이루어진 테스트 군에 하루에 약 1시간, 3일 동안 테스트를 진행한 후 고정선택 질문의 형태 설문조사를 진행하였다. VR에 최적화된 시스템으로 개발한다면 문서뷰어를 통해 볼 수 있는 다양한 데이터에 모두 적용될 수 있으며 2D와 3D를 아우르는 뷰어 환경을 제공하여 기존의 문서뷰어를 뛰어넘는 새로운 시스템으로 사용자를 만족할 수 있을 것이라는 결론을 도출했다. 문서 뷰어에서 중요한 것은 사용자 만족과 지속 사용의도와 관련된 집중도이다. 본 연구는 가상현실 환경에 맞는 문서 뷰어의 프로토 타입 연구로써, 문서를 읽을 시 몰입감을 이끌어내고 시각적인 피로도와 문서의 시각적 인지에 효과적인 새로운 문서 뷰어의 방향을 제시해 줄 수 있을 것이다.

InferSent를 활용한 오픈 도메인 기계독해 (Open Domain Machine Reading Comprehension using InferSent)

  • 김정훈;김준영;박준;박성욱;정세훈;심춘보
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.89-96
    • /
    • 2022
  • 오픈 도메인 기계독해는 질문과 연관된 단락이 존재하지 않아 단락을 검색하는 검색 기능을 추가한 모델이다. 문서 검색은 단어 빈도 기반인 TF-IDF로 많은 연구가 진행됐으나 문서의 양이 많아지면 낮은 성능을 보이는 문제가 있다. 아울러 단락 선별은 단어 기반 임베딩으로 많은 연구가 진행됐으나 문장의 특징을 가지는 단락의 문맥을 정확히 추출하지 못하는 문제가 있다. 그리고 문서 독해는 BERT로 많은 연구가 진행됐으나 방대한 파라미터로 느린 학습 문제를 보였다. 본 논문에서는 언급한 3가지 문제를 해결하기 위해 문서의 길이까지 고려한 BM25를 이용하며 문장 문맥을 얻기 위해 InferSent를 사용하고, 파라미터 수를 줄이기 위해 ALBERT를 이용한 오픈 도메인 기계독해를 제안한다. SQuAD1.1 데이터셋으로 실험을 진행했다. 문서 검색은 BM25의 성능이 TF-IDF보다 3.2% 높았다. 단락 선별은 InferSent가 Transformer보다 0.9% 높았다. 마지막으로 문서 독해에서 단락의 수가 증가하면 ALBERT가 EM에서 0.4%, F1에서 0.2% 더 높았다.

이미지 필터와 제한조건을 이용한 문서영상 구조분석 (Document Image Layout Analysis Using Image Filters and Constrained Conditions)

  • 장대근;황찬식
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.311-318
    • /
    • 2002
  • 문서영상 구조분석은 문서영상을 세부 영역으로 분할하는 과정과 분할된 영역을 문자, 그림, 표 등으로 분류하는 과정을 포함한다. 이 중 영역분류 과정에서 영역의 크기, 흑화소 밀도, 화소 분포의 복잡도는 영역을 분류하는 기준이 된다. 그러나 그림의 경우 이러한 기준들의 범위가 넓어 경계를 정하기 어려우므로 다른 형태에 비해 상대적으로 오분류의 비율이 높다. 본 논문에서는 그림과 문자를 분류하는 과정에서 영역의 크기, 흑화소 밀도, 화소 분포의 복잡도에 의한 영향을 줄이기 위하여 메디안 필터를 이용하고, 영역확장 필터(region expanding filter)와 제한 조건들을 이용하여 영역분류에서의 오분류를 수정함으로써 상용제품을 포함한 기존 방법에 비해 그림과 문자의 분류가 우수한 문서영상 구조 분석 방법을 제안한다.

자원공유 수단으로서의 전문 데이터베이스 (Full-text databases as a means for resource sharing)

  • 노진구
    • 한국도서관정보학회지
    • /
    • 제24권
    • /
    • pp.45-79
    • /
    • 1996
  • Rising publication costs and declining financial resources have resulted in renewed interest among librarians in resource sharing. Although the idea of sharing resources is not new, there is a sense of urgency not seen in the past. Driven by rising publication costs and static and often shrinking budgets, librarians are embracing resource sharing as an idea whose time may finally have come. Resource sharing in electronic environments is creating a shift in the concept of the library as a warehouse of print-based collection to the idea of the library as the point of access to need information. Much of the library's material will be delivered in electronic form, or printed. In this new paradigm libraries can not be expected to su n.0, pport research from their own collections. These changes, along with improved communications, computerization of administrative functions, fax and digital delivery of articles, advancement of data storage technologies, are improving the procedures and means for delivering needed information to library users. In short, for resource sharing to be truly effective and efficient, however, automation and data communication are essential. The possibility of using full-text online databases as a su n.0, pplement to interlibrary loan for document delivery is examined. At this point, this article presents possibility of using full-text online databases as a means to interlibrary loan for document delivery. The findings of the study can be summarized as follows : First, turn-around time and the cost of getting a hard copy of a journal article from online full-text databases was comparable to the other document delivery services. Second, the use of full-text online databases should be considered as a method for promoting interlibrary loan services, as it is more cost-effective and labour saving. Third, for full-text databases to work as a document delivery system the databases must contain as many periodicals as possible and be loaded on as many systems as possible. Forth, to contain many scholarly research journals on full-text databases, we need guidelines to cover electronic document delivery, electronic reserves. Fifth, to be a full full-text database, more advanced information technologies are really needed.

  • PDF

전문 처리를 위한 웹 기반 정보시스템 구현 (Implementation of Web-based Information System for Full-text Processing)

  • 김상도;문병주;류근호
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1481-1492
    • /
    • 1999
  • 1990년대 웹 개념의 등장으로 인터넷을 개방형 네트?, 사용자 친근성 및 편의성이라는 특성을 바탕으로 급속히 일반화되면서 각종 정보를 제공하는 정보 시스템에서도 커다란 변화를 가져왔다. 웹은 텍스트 정보뿐만 아니라 이미지, 오디오, 비디오 등 멀티미디어 정보를 쉽게 제공함으로써 기존 정보 시스템의 웹 기반으로의 전환을 가속화시키게 되었다. 물론 정보 내용도 텍스트 위주의 단순 초록 정보에서 전문(Full-Text) 정보로 급속히 이전되기 시작하였으며, 전문 정보를 처리하는 다양한 문서 포맷들로 등장하기 시작하였다. 하지만, 전문 정보는 본질적으로 대용량의 시스템 메모리, 막대한 처리시간, 보다 많은 전송용량 등을 요구하게 되므로 웹 기반 전문 시스템의 구축시 이러한 요인들을 세밀하게 비교 평가하여야 한다. 따라서 본 연구는 웹 기반 정보 시스템에서 어떻게 전문을 처리할 것인가에 초점을 맞추어 문서의 통합 정보 기능을 제공하는 정보시스템을 설계 구현한다. 먼저 인터넷상에서 표준 문서형식으로 사용중이거나 개발중인 문서 포맷들의 특징을 검토하고, 정보 시스템의 관점에서 전문정보를 어떤 문서 포맷으로 처리하는 것이 적합한가를 실험하고 평가한다. 그리고 이를 기반으로 본 연구의 목적인 전문 정보를 PDF 문서로 제공하는 웹 기반 정보 시스템을 설계 구현한다.

  • PDF

BART 기반 문서 요약을 통한 토픽 모델링 성능 향상 (Performance Improvement of Topic Modeling using BART based Document Summarization)

  • 김은수;유현;정경용
    • 인터넷정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.27-33
    • /
    • 2024
  • 정보의 증가 속에서 학문 연구의 환경은 지속적으로 변화하고 있으며, 이에 따라 대량의 문서를 효과적으로 분석하는 방법의 필요성이 대두된다. 본 연구에서는 BART(Bidirectional and Auto-Regressive Transformers) 기반의 문서 요약 모델을 사용하여 텍스트를 정제하여 핵심 내용을 추출하고, 이를 LDA(Latent Dirichlet Allocation) 알고리즘을 통한 토픽 모델링의 성능 향상 방법을 제시한다. 이는 문서 요약을 통해 LDA 토픽 모델링의 성능과 효율성을 향상시키는 접근법을 제안하고 실험을 통해 검증한다. 실험 결과, 논문 데이터를 요약하는 BART 기반 모델은 Rouge-1, Rouge-2, Rouge-L 성능 평가에서 각각 0.5819, 0.4384, 0.5038의 F1-Score를 나타내어 원문의 중요 정보를 포착하고 있음을 보인다. 또한, 요약된 문서를 사용한 토픽 모델링은 Perplexity 지표를 통한 성능 비교에서 원문을 사용한 토픽 모델링의 경우보다 약 8.08% 더 높은 성능을 보인다. 이는 토픽 모델링 과정에서 데이터 처리량의 감소와 효율성 향상에 기여한다.

토픽모델링과 딥 러닝을 활용한 생의학 문헌 자동 분류 기법 연구 (A Study of Research on Methods of Automated Biomedical Document Classification using Topic Modeling and Deep Learning)

  • 육지희;송민
    • 정보관리학회지
    • /
    • 제35권2호
    • /
    • pp.63-88
    • /
    • 2018
  • 본 연구는 LDA 토픽 모델과 딥 러닝을 적용한 단어 임베딩 기반의 Doc2Vec 기법을 활용하여 자질을 선정하고 자질집합의 크기와 종류 및 분류 알고리즘에 따른 분류 성능의 차이를 평가하였다. 또한 자질집합의 적절한 크기를 확인하고 문헌의 위치에 따라 종류를 다르게 구성하여 분류에 이용할 때 높은 성능을 나타내는 자질집합이 무엇인지 확인하였다. 마지막으로 딥 러닝을 활용한 실험에서는 학습 횟수와 문맥 추론 정보의 유무에 따른 분류 성능을 비교하였다. 실험문헌집단은 PMC에서 제공하는 생의학 학술문헌을 수집하고 질병 범주 체계에 따라 구분하여 Disease-35083을 구축하였다. 연구를 통하여 가장 높은 성능을 나타낸 자질집합의 종류와 크기를 확인하고 학습 시간에 효율성을 나타냄으로써 자질로의 확장 가능성을 가지는 자질집합을 제시하였다. 또한 딥 러닝과 기존 방법 간의 차이점을 비교하고 분류 환경에 따라 적합한 방법을 제안하였다.

복사문서의 문서간주가 창출한 새로운 변조개념에 의해 문서변조행위대상으로 평가되는 컴퓨터모니터 이미지 (The Computer Monitor's Image Evaluated at The Target of The Falsification According to The New Conception of The Falsification Made by Regarding the Reproduced Document as The Document of Document crime)

  • 류석준
    • 법제연구
    • /
    • 제44호
    • /
    • pp.725-756
    • /
    • 2013
  • 대상판결은 제1사문서행위와 관련된 사안에서 스캔하여 컴퓨터모니터 화면상의 이미지를 변경함으로써 금액란을 공난으로 만들어 프린트로 출력한 사무실전세계약서를 심판의 대상으로 보고 있다. 그러나 이 출력물은 금액란이 공난으로 되어 있고, 판례는 변조행위는 진정한 문서만을 대상으로 성립될 수 있다는 관점을 취하고 있으므로 이러한 판례에 따르면 이는 변조행위의 대상으로 평가될 수 없다. 따라서 대상판결의 심판대상에 대해 사문서변조죄가 반드시 성립된다고 할 수는 없다. 그러나 변조개념에 대한 고찰과 복사문서의 문서성, 그리고 문서죄의 보호법익과 법익보호의 정도를 고려하여 변조개념을 새롭게 이해함으로써 그 개념의 확장이 가능하다면 대상사안 행위에 대한 문서변조죄의 성립이 인정될 수도 있다. 또한 이러한 논의는 본 사안의 심판대상을 대상판결의 관점과 다르게 보는 것이 가능하다는 전제 하에서 가능하다. 심판대상의 변경에 의해 제1사문서변조행위를 일련의 연속된 행위(스캔-컴퓨터모니터 화면상의 이미지 변경-출력 후 수기 변경)로 이해하게 되면 이러한 행위는 원본문서를 복사하여 만들어진 복사문서를 그 변조의 대상으로 하여 문서변조행위를 하는 것과 질적으로 달리 평가되지 않는다. 따라서 제1사문서변조행위에 대한 문서변조행위의 성립을 인정할 수 있다. 물론 이것은 변조의 행위객체와 변조의 대상의 분리가 가능하다는 전제에서 가능하다. 그리고 이것은 복사문서의 문서성에 의할 때 불가능한 것이 아니다. 이러한 분리가능성에 의하게 되면 원본문서 자체에 어떠한 변경도 가하지 않는 변조개념의 상정이 가능하게 된다. 이러한 분리에 대한 논의가 필요한 것은 심판의 대상을 변경하더라도 대상판결이 전제한 심판대상에서와 마찬가지로 그 행위의 대상이 무엇인지 포착하는 것이 쉽지 않기 때문이다. 그러나 이러한 분리개념에 의하게 되면 컴퓨터모니터 화면상의 이미지를 변조행위의 대상으로 평가할 수 있다. 물론 이것은 문서죄의 행위객체는 문서라는 일반적인 견해와 컴퓨터모니터 화면상의 이미지는 문서죄의 문서가 아니라는 판례의 관점과 충돌하는 것으로 비춰질 수 있다. 그러나 전술한 바에 따른 변조개념의 확장에 의한다면 이러한 충돌은 존재하지 않는다. 즉 변경된 심판대상에서 변조행위의 객체는 원본문서이고 변조의 대상은 기술적인 방법에 의해 그것을 담을 수 있는 형식이 배제된 채 별도로 원본문서로부터 추출된 문서의 '내용'인 것으로 볼 수 있다면 대상사안의 행위는 문서변조행위로 평가될 수 있다. 대상판결은 제2사문서변조행위에 제1사문서변조행위의 경우와 달리 심판대상을 구체적으로 적시하고 있지 않다. 그러나 대상판결의 취지상 컴퓨터모니터 화면에서 그 내용을 변경한 출력물을 심판대상으로 보고 있는 것으로 이해된다. 그러나 이에 대해 사후적 변경행위가 없다는 점에서 이를 심판대상으로 볼 수는 없다. 따라서 이에 대해서도 제1사문서변조행위와 마찬가지로 심판대상의 변경을 고려하지 않을 수 없다. 이러한 심판대상의 변경에 의하면 이는 제1사문서변조행위의 경우와 그 행위구조에 있어서 달리 이해되지 않는다. 따라서 이에 대해서도 문서변조행위로 평가될 수 있다. 결론적으로 대상사안의 행위들은 변조개념의 확장이 가능하다는 전제하에서 문서변조행위로 평가될 수 있고, 이러한 변조개념의 확장에 의한다면 컴퓨터모니터 화면상의 이미지는 문서죄의 문서로 평가될 수 없으나 변조행위의 대상으로서 그 의미를 지닌다고 할 수 있을 것이다.