• 제목/요약/키워드: 문서처리시스템

검색결과 1,387건 처리시간 0.027초

위젯 서비스를 위한 오픈 API 프록시 서버 시스템 (An Open API Proxy Server System for Widget Services)

  • 안병현;이혁준;최용훈;정영욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권9호
    • /
    • pp.918-926
    • /
    • 2010
  • 위젯은 자주 이용하는 서비스를 독립적으로 구동시키는 작은 응용프로그램으로서, 콘텐츠를 제공하는 웹 사이트 등을 직접 방문하지 않고도 사용자가 원하는 콘텐츠를 손쉽게 얻을 수 있어서 많은 관심을 끌고 있다. 이러한 위젯은 오픈 API를 이용하면 손쉽게 개발될 수 있다. 하지만 위젯의 다양한 응용 가능성에도 불구하고, 현재 오픈 API를 제공하는 웹 사이트가 많지 않다. 그 이유는 웹 사이트 운영자가 오픈 API를 제공하기 위해서는 기존의 웹 서버 구조를 변경하거나 웹 서버 리소스를 수정해야 하는 어려움이 있기 때문이다. 본 논문에서는 기존의 웹 서버 구조 또는 웹 서버 리소스를 변경하지 않고, 개발자가 위젯 개발을 가능하도록 하는 것은 물론, 사용자가 위젯을 사용할 수 있도록 웹 서버를 대신하여 오픈 API를 제공하는 오픈 API 프록시 서버 시스템을 제안한다. 오픈 API 프록시 서버 시스템의 구성은 크게 오픈 API 소스 코드 생성기와 오픈 API 프록시 서버로 이루어져 있다. 오픈 API 소스 코드 생성기는 사용자가 원하는 오픈 API를 생성하도록 사용자에게 GUI를 제공하여 오픈 API 프록시 서버로 오픈 API 소스 코드 생성 요청을 보내는 프로그램이다. 오픈 API 프록시 서버는 본 논문에서 제안하는 HTML 테이블 처리 라이브러리를 이용하여 웹 사이트로부터 HTML 웹 페이지를 받아서 대상 HTML 테이블로부터 유용한 정보를 추출한다. 그리고 이를 XML 문서로 가공하여 오픈 API를 통해 제공한다. 실제 웹 사이트의 HTML 테이블을 대상으로 실험하여 오픈 API 프록시 서버 시스템의 동작을 검증하였다.

효율적 XML키워드 검색을 인덱스 분할 및 합병 (Partitioning and Merging an Index for Efficient XML Keyword Search)

  • 김성진;이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.754-765
    • /
    • 2006
  • 일반적으로 XML 키워드 검색에서 검색 결과는 질의 키워드들을 모두 포함하는 가장 작은 원소(최소 공통 선조)로 정의되며 색인의 기본 단위는 XML 원소가 된다. 기존의 인덱스 구조 하에서는 질의 키워드를 포함한 각 원소의 조합으로 생성된 모든 최소 공통 선조가 검색 결과로 고려된다. 본 논문에서는-불필요한 최소 공통 선조 산출 연산을 피하고 검색 시간을 단축시키기 위한 목적으로-인덱스를 파티션이라고 불리는 물리적 단위로 분할하고 질의 처리 시 필요에 따라 파티션을 동적으로 합병하여 검색 결과를 산출하는 기법을 기술한다. 주어진 깊이 이상의 최소 공통 선조가 검색 결과로 반환되어야할 경우, 검색 시스템은 제안된 인덱스 구조 하에서 동일 파티션에 속한 원소들 간의 조합만으로 검색 결과를 반환함으로써 검색 시간을 단축시킬 수 있다. 검색 결과에 대한 깊이 제한이 주어지지 않을 경우에도 검색 시스템은 분할된 인덱스를 사용하여 검색 결과를 얻을 수 있으며, 이때 분할되지 않은 기존의 인덱스를 사용하는 검색과 동일한 시간이 소요된다. 실험은 DBLP 사이트와 INEX2003에서 제공되는 XML 문서들로 진행되었으며, 제안된 인덱스는 검색 결과의 최소 깊이가 주어질 경우 질의 처리 시간을 상당히 감소시켰다.

유닉스 시스템에서 C 언어 출력 방법이 CGI 게이트웨이 성능에 미치는 영향 (The Effect of C Language Output Method to the Performance of CGI Gateway in the UNIX Systems)

  • 이형봉;정연철;권기현
    • 정보처리학회논문지C
    • /
    • 제12C권1호
    • /
    • pp.147-156
    • /
    • 2005
  • CGI는 유닉스 운영체제의 표준 입${\cdot}$출력 환경에서 프로그램의 출력 결과가 고정적인 웹 문서를 대신하도록 고안된 게이트웨이와 웹 서버 사이의 표준 접속 규약이다. 따라서 CGI 게이트웨이에서는 사용된 언어가 제공하는 표준 입${\cdot}$출력 문장을 사용하는 것이 자연스럽다. 그런데 표준 입${\cdot}$출력 메커니즘은 보편적인 환경에 적합하도록 운영체제에 투명하게 설계된 버퍼 전략 중의 하나이다. 이것은 CGI 환경이라는 독특한 특성이 고려될 경우 표준 입${\cdot}$출력 부분이 웹 성능향상을 위한 또 다른 최적화 대상이 될 수 있음을 의미한다. 이 논문에서는 유닉스/리눅스 시스템에서 C 언어로 작성된 CGI 게이트웨이를 위한 출력의 최적화 분야를 표준 출력 방법과 파일 출력 방법으로 분류하고, 각 분야별 제안된 최적화 방안들을 Debian LINUX, IBM AIX, SUN Solaris, Digital UNIX 등 네 운영체제를 대상으로 적용하여 그 영향을 실행시간 위주로 분석하였다. 그 결과 운영체제에 따라 상당한 차이를 보였는데, 기본 방법에 비해 표준 출력 분야에서 $10{\%}$ 이상 향상된 경우가 있었던 반면 성능 향상이 당연시 되었던 파일 출력 방법에서는 오히려 $60{\%}$ 이상 저하되는 최악의 경우가 관찰되었다.

인트라넷에서 가상데이터베이스를이용한 데이터베이스 검색 시스템의 설계 (Design for Database Retrieval System using Virtual Database in Intranet)

  • 이동욱;박영배
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1404-1417
    • /
    • 1998
  • 현재 웹을 통하여 인터넷 데이터베이스를 검색하는 방법에는 검색 엔진 기술을 이용한 방법과, 둘째 플러그인 기술이나 엑티브엑스 기술을 이용한 검색 방법으로 나눌 수 있다. 검색 엔진을 이용하는 방법은 단순 문서와 같은 대량의 텍스트 데이터를 키워드와 같은 인덱스를 구축하고 이를 이용하여 검색하는 방법으로서, 문제점은 하나 이상의 데이터베이스를 동시에 검색하지 못하고 또 질의어와 같은 다양한 형태의 조건 검색을 할 수가 없으며, 사용자의 요구에 맞지 않는 데이터가 많이 전송된다는 즉, 정확성이 낮다는 세 가지 점을 들 수 있다. 플러그인 기술이나 액티브엑스 기술을 이용하는 방법은 웹 화면상에서 DBMS를 이용하여 클라이언트의 질의를 실행시켜 데이터베이스를 검색하는 방법으로서, 문제점은 동일한 데이터모델의 경우라도 하나 이상의 DBMS를 동시에 기동시킬 수 없고 또 클라이언트 프로그램에서 미리 정의된 질의 이외의 다양한 종류의 질의를 할 수 없다는 두 가지 점을 들 수 있다. 본 논문에서는 이러한 문제점들을 해결하기 위해서 인터넷/인트라넷상에서 새로운 개념으로 작성한 가상데이터베이스를 이용하여 웹 화면을 통해서 다양한 종류의 질의를 직접 할 수 있는 데이터베이스 검색 시스템을 설계하는 데에 있다. 여기서, 가상데이터베이스는 동일한 관계데이터 모델로서 하나 이상의 관계 DBMS를 사용하는 것으로 가정한다.

  • PDF

스타일 기반 키워드 추출 및 키워드 마이닝 프로파일 기반 웹 검색 방법 (An Efficient Web Search Method Based on a Style-based Keyword Extraction and a Keyword Mining Profile)

  • 주길홍;이준휘;이원석
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1049-1062
    • /
    • 2004
  • World Wide Web의 대중화로 인해 전자 정보량이 급속하게 증가하였고, 이러한 많은 양의 다양한 정보에 대한 효율적인 검색 시스템의 필요성이 증대되었다. 정확한 검색 결과를 제공하기 위해 사용자 요구 사항의 올바른 분석과 서술이 중요하게 인식되고 있으며, 분산 환경에서의 요구 사항 추출 및 분석의 필요성이 대두되고 있다. 본 논문에서는 웹 검색 방법에 있어서 목표 검색어만을 가지고 검색을 수행하는 기존 검색 방법과 달리 검색어가 나타나는 문맥 정보를 추가하여 검색하는 방법을 제안하고 구현하였다. 또한 본 논문에서는 제안된 새로운 키워드 추출 방법으로 추출된 키워드를 기반으로 키워드 마이닝 프로파일에 기반한 웹 검색 시스템을 제안하고 구현하였다. 이는 원하는 정보를 대표하는 목표 검색어만 가지고 검색을 수행하는 기존의 검색방법과 달리 검색어가 포함된 문맥정보를 추가하여 검색하기 때문에 기존의 검색방법보다 정확하고 효율적인 정보를 제공한다. 특정 도메인으로부터 순위가 매겨진 도메인 키워드 리스트를 작성하여 이를 기준으로 기존의 출현빈도기반의 차이를 실험을 통하여 보였으며, 예제 기반 질의를 바탕으로 키워드 마이닝 프로파일을 만들어 검색을 수행하는 검색 방법으로 이의 효용성을 실험을 통해 검증하였다.

스마트 모바일 어플리케이션을 이용한 건설 자재 관리 (Construction Material Management Using Smart Mobile Computing)

  • 이광표;이현수;박문서;김의준
    • 한국건설관리학회논문집
    • /
    • 제12권4호
    • /
    • pp.59-69
    • /
    • 2011
  • 최근 건설 공사가 대형화, 복잡화되어 감에 따라 건설 산업에서는 Information Technology (IT) 기술의 도입을 통한 생산성 향상을 추구하며, 보다 효율적인 건설 관리 방안을 도출하고자 한다. 이러한 배경을 바탕으로 다양한 종류의 건설 관리시스템 (Project Management System)이 도입되고 있으며, 이와 더불어 Personal Digital Assistant (PDA), Bar Code, Radio Frequency Identification (RFID), Web Camera 등의 다양한 IT 기술이 적용되고 있는 상황이다. 그러나 이와 같은 기술들은 실시간 정보처리 기술의 부족, 건설 현장과 관리 오피스의 이원화 등으로 인하여 정보의 재작업 및 비효율성을 초래하여, 데이터의 저장 및 데이터베이스 (Database) 기능을 제외한 부분에서는 오히려 건설 생산성을 저해시키고 있는 상황이다. 이에 본 연구는 설문조사를 바탕으로 기존 관리상의 문제점을 파악하고, 요구사항 분석을 통하여 기능을 도출함으로써 건설 자재 관리 부문에 있어 건설 현장 내 적용성이 뛰어난 어플리케이션을 개발하고자 한다. 본 연구에서 개발하고자 하는 건설 자재 관리 어플리케이션은 정보의 자동 입력, 자재 정보의 실시간 처리 및 확인, 조달 자재 위치 확인을 가능하게 하여 건설 현장과 관리 오피스 간의 이원화 문제를 해결하도록 한다. 이와 더불어 최신 IT 디바이스 (Device)인 스마트폰의 건설 현장 내 도입 가능성 및 적용성을 확인해 보고자 한다.

국가기록원의 기록물 정리기술의 현황과 개선방안 (The Present State and Solutions for Archival Arrangement and Description of National Archives & Records Service of Korea)

  • 윤주범
    • 한국기록관리학회지
    • /
    • 제4권2호
    • /
    • pp.118-162
    • /
    • 2004
  • 기록물 보존기관에서의 정리와 기술은 기록물 관리와 열람제공에 중요한 역할을 한다. 국가기록원(NRAS; National Records & Archinves Service)에서도 역시 정리와 기술에 대해 노력을 기울이고 있다. 하지만, 기록보존 선진국과 비교하면 이론 및 실제 처리과정에서 많은 차이와 문제점을 가지고 있다. 이론에 있어서 큰 차이는, 기록물의 기능분류와 원질서의 유지나 다계층기술이 정리 기술의 실제 업무처리에 반영되고 있지 않다. 즉, 기록물이 도서의 정리방식과 같이 낱권 단위로 등록순서에 따라 정리된 후 서가에 배열되고 있다. 이 외에도, 기록물 생산기관의 변천내력이나 색인어의 관리 등의 문제점을 가지고 있다. 이런 이유로 기록물의 이용이 매우 불편하다. 이들 문제점을 개선하기 위해서, 본 연구에서는 정리와 기술의 의의와 중요성, 국가기록원의 정리와 기술의 현황과 문제점, 그리고 외국의 국립기록보존소 기술지침을 소개하였다. 다음은 ISAD(G)를 적용한 사례를 소개하였다. 논문은 총 8장으로 구성하였는데, 제1장 서론, 제2장 정리 기술의 의의와 중요성 및 제8장 결론을 제외한 제3장부터 제7장의 내용은 다음과 같다. 제3장에서는 국가기록원의 정리 기술 현황으로, 현재 사용하고 있는 기록물관리 시스템(Govt) 운영현황과 사용하는 기술항목을 설명하였다. 제4장에서는 미국, 영국 및 호주의 국립기록보존소 기술지침 소개로 첫째, 미국의 국립기록관리청(NARA)의 기록물 생명주기 데이터 준수사항 지침(Lifecycle Data Requirements Guide)을 소개하였으며, 기술 항목중 타이틀요소 1개에 대한 기술요령을 소개하였다. 둘째, 영국국립기록보존소(Public Records Office)의 기술지침을 소개하였다. 기술지침의 명칭은 영국국립기록보존소 편목지침(National Archives Cataloguing Guidelines Introduction)이다. 이 지침에서 사용하는 "PROCAT"라는 전산목록시스템을 소개하였다. 이 시스템에서 사용하는 7단계 기술에 대해 설명하였다. 셋째, 호주 국립기록보존소(NAA; National Archives of Australia)의 기록물 시스템은 CRS(Commonwealth Record Series)이다. 이 시스템을 위한 기록물 등록과 기술절차(Registration &description procedures for CRS system)에 대해 연구하였다. 제5장에서는 ISAD(G)를 적용한 사례로, 국가기록원이 과거 총무처 소청심사위원회에서 생산한 기록물의 기술서를 소개하였다. 제6장, 7장에서는, ISAD(G)의 사용결과 문제점, 각 기관 처리과에서 문서제목 부여, 기술항목 부족, 기록물 종류나 유형분류, 관리번호, 상세한 기술규칙의 부재, 기능분류나 계층기술, 입력포맷, 서가배열, 전거통제 등의 문제점을 지적하였다. 개선 방안으로는 계층분류 체계의 마련, 관리번호 및 배열순서의 개선, 전거제어시스템 개발, 기술 입력항목의 증가, 기술규칙 제정 및 입력포맷개선 마련 등이다. 현재 국가기록원의 정리 기술 개선의 가장 좋은 방법은 기록물관리 선진국 국립기록보존소의 표준, 지침, 매뉴얼의 상세한 검토이다. 따라서 학계에서 이 분야의 많은 연구가 있어야 한다는 것을 제안하였다.

적응형 웹 서핑 지원을 위한 에이전트 시스템 (An Agent System for Supporting Adaptive Web Surfing)

  • 국형준
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.399-406
    • /
    • 2002
  • 본 연구는 웹 서핑 지원을 위한 적응형 사용자 에이전트의 설계를 위해 사용자 데이터 수집, 데이터 처리를 통한 사용자 프로파일 구축 및 개선, 그리고 사용자 프로파일의 적용을 통한 적응 등 세 가지 이슈를 집중 연구하였다. 그 결과 웹 상에서 작동하는 적응형 사용자 에이전트를 위한 기능 정의 및 주요 구성 요소들을 설계하고 세부 모형을 구현하였다. 내부적으로는 두 개의 독립된 에이전트의 협동 체제에 의해 작업 목표를 성취한다. 이들은 각각 IIA(Interactive Interface Agent) 및 UPA(User Profiling Agent)이다. 사용자 인터페이스를 관장하는 IIA는 사용자에게 현재 웹 문서의 대강을 파악하고 나아가서 검색 질의어를 선택할 수 있게 하는 키워드 색인(Keyword Index)과, 계층 구조 방식의 사용자 검색 과정을 나타내는 제안 링크(Suggest Link)를 제공함으로서 사용자 친숙한 인터페이스 환경을 제시한다. UPA는 사용자에 관한 정적 정보와 브라우징 행위에서 나타나는 동적 정보를 사용자 프로파일에 반영한다. 특히, 사용자 관심을 반영하는 관심 벡터(Interest Vector)의 개념을 정립하고 근접도(similarity) 평가에 의해 이들을 갱신하고 추가함으로써 사용자 관심을 동적으로 프로파일링하는 체계를 제시하였다.

TripleDiff: 트리플 저장소에서 RDF 문서에 대한 점진적 갱신 알고리즘 (TripleDiff: an Incremental Update Algorithm on RDF Documents in Triple Stores)

  • 이태휘;김기성;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.476-485
    • /
    • 2006
  • 시멘틱 웹(semantic web)과 함께 등장한 RDF는 웹 상의 메타데이타 및 데이타를 나타내는 표준으로 자리매김 하고 있다. 이에 따라 RDF에 대한 저장 및 질의 처리에 대한 연구가 많이 이루어졌으며, 대표적인 시스템으로 Sesame, Jena 등이 있다. 그러나 아직 갱신 방법에 대한 연구는 부족하다. RDF 데이타가 지속적으로 갱신이 이루어지는 경우에는 저장된 RDF를 갱신해야 하는 상황이 발생한다. 현존하는 RDF 저장소에서 데이타를 갱신하기 위해서는 기존의 데이타를 모두 삭제한 후 새로운 데이타를 처음부터 다시 저장해야 하는데, 이러한 상황에서는 매우 비효율적이다. 또한 한 RDF 저장소에 여러 RDF가 저장되어 있는 경우에는 갱신 문제가 더욱 복잡해진다. 이에 본 논문에서는 RDF 데이타를 점진적으로 갱신하는 기법을 제안하고자 한다. 제안한 기법은 텍스트 비교 알고리즘을 통해 얻은 결과를 보완하여 기존 RDF 데이타에서 변화된 트리플 문장만을 추출하여 갱신한다. 실제 RDF 데이터를 이용한 실험을 통해 제안한 방법을 사용하여 갱신을 효율적으로 할 수 있음을 보였다.

제품 설명서에 나타나는 중의적 명사 수식 구문 연구 - 통제 언어의 관점에서- (A study on the ambiguous adnominal constructions in product documentation)

  • 박아름;지은별;홍문표
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.23-28
    • /
    • 2012
  • 번역을 지원하는 도구로 자동 번역 시스템을 효율적으로 활용하기 위해 중요한 것은 자동 번역에 적합하도록 원문을 작성하거나 이미 작성된 원문에 대한 전처리 작업을 하는 것이다. 본 연구의 궁극적인 목표는 제품 설명서 작성자가 통제언어 체커를 통해 통제언어 규칙들을 적용하여 원문을 작성하도록 하는 것이다. 본 논문은 그 중간 단계로써 제품 설명서에 나타나는 문제 사항이 번역 품질에 어떠한 영향을 미치는지 밝혀내는 것을 목적으로 한다. 연구 대상은 제품 설명서에서 자동 번역의 성능을 저해시키는 요소 중 중의적 명사 수식 구문이다. 이러한 명사 수식 구문들은 분석 단계에서 구조적인 모호성을 초래하여 한국어 분석의 정확도를 떨어뜨리기 때문에 결과적으로 번역 품질을 악화시킬 수 있다. 이를 검증하기 위해 우선 제품 설명서 데이터를 분석하여 자동 번역 결과에 부정적인 영향을 미치는 명사 수식 구문을 다음과 같이 4가지로 유형화 하였다. (유형 1) 관형격 명사구 + 명사 병렬 접속, (유형 2) 동사의 관형형이 수식하는 명사구 + 명사 병렬 접속, (유형 3) 관형격 조사 '의' 중복, (유형 4) 병렬 접속어를 잘못 쓴 경우, 각각의 유형에 대해서 한국어 분석 단계에서 발생할 수 있는 문제에 대해 설명하였으며, 문제 사항에 대해 통제언어 규칙을 제시하였다. 통제언어 규칙에 따라 중의적 명사 수식 구문을 수정한 결과, 한국어 원문의 번역결과보다 한국어 수정문의 번역결과가 작성자의 의도를 더 잘 나타낸다는 것을 확인할 수 있었다.

  • PDF