• 제목/요약/키워드: 데이터 공개

검색결과 1,026건 처리시간 0.029초

대전시 공공 자전거(타슈) 공개 데이터 시각화 및 분석 (Visualization and Analysis of Public Bicycle Rental Data in Daejeon(Tashu))

  • 문현수;이영석
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권6호
    • /
    • pp.253-267
    • /
    • 2016
  • 세계 주요 도시는 대중교통이 가지고 있는 문제를 보완하기 위해 공공 대여 자전거 시스템을 운영하고 있다. 대전시에서 최근에 대여 이력 데이터를 공개하여 새로운 분석 가능성을 열었다. 본 연구는 시각화를 이용해서 데이터의 의미를 파악할 수 있는 분석 방법을 제안한다. 실험 결과 이용률에 따른 정류장의 위치적 특징을 발견하였고, 시간/요일/월에 따라서 달라지는 자전거 이용 패턴을 알 수 있었다. 한편 이동 경로 분석을 통해서 정류장간 이용 패턴을 발견하였으며, 각 정류장별 목적지 비율 분석을 통해 이용 목적을 파악할 수 있었다. 이러한 데이터를 기반으로 대전시 공공 대여 자전거 시스템 발전 방향을 제시한다.

정보공개 환경에서 개인정보 보호와 노출 위험의 측정에 대한 통계적 방법 (Review on statistical methods for protecting privacy and measuring risk of disclosure when releasing information for public use)

  • 이용희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.1029-1041
    • /
    • 2013
  • 최근 빅데이터의 등장과 정보 공개에 대한 급격한 수요 증가에 따라 자료를 일반에게 공개할 때 개인 정보를 보호해야 하는 필요성이 어느 때보다 절실하다. 본 논문에서는 마이크로 자료와 통계분석 서버를 중심으로 현재까지 제시된 개인정보 노출제한를 위한 통계적 방법, 정보 노출의 개념, 노출 위험을 측정하는 기준들을 개괄적으로 소개한다.

연구 데이터의 출판과 인용에 관한 연구 (A Study on Publication and Citation of Research Data)

  • 이상호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.65-66
    • /
    • 2017
  • 최근 오픈 사이언스 운동과 함께 정부 부처, 연구비 지원기관 등에서는 공적 기금으로 연구를 수행하는 경우 생성된 각종 연구 데이터를 관리하고 공개하도록 의무화하려는 움직임이 있다. 데이터에 DOI와 같은 식별자를 부여하여 데이터 리파지토리를 통해 출판하면 이해당사자들에게 많은 이익을 가져다 줄 수 있으며, 데이터의 인용을 활성화하기 위해 주제별 또는 기관별 리파지토리나 데이터센터에서 표준적인 인용 방법과 인용 요소들을 발표하고 있다. 앞으로 과학연구의 공개, 개방화가 더욱 추진되면 더욱 많은 연구데이터의 공유 활동이 일어날 것으로 예상되며 분야별 또는 유형별로 국제적인 데이터 리파지토리들이 출현하여 학술 논문의 근거가 되는 데이터 저장소로서의 역할을 수행할 것으로 생각된다.

  • PDF

한국의 우주탐사 과학데이터 공개시스템 (The Public Release System for Scientific Data from Korean Space Explorations)

  • 김주현
    • 우주기술과 응용
    • /
    • 제3권4호
    • /
    • pp.373-384
    • /
    • 2023
  • 우리나라 최초의 우주탐사 개발사업으로 시작된 달 탐사 개발사업은 다누리 달 궤도선뿐만 아니라 임무목적을 달성하기 위한 탑재체와 이를 운영하기 위한 심우주지상시스템도 함께 개발되었다. 다누리에 탑재된 국내 기관이 개발한 4기의 과학탑재체가 획득한 달 탐사 과학데이터는 2024년 1월부터 일반 대중에게 공개될 예정이다. 이를 위하여 우리나라 최초의 우주탐사 과학데이터 관리 및 공개시스템인 KPDS(KARI Planetary Data System)가 개발되었다. 본 논문에서는 구축된 KPDS 웹사이트의 구성과 기능에 대하여 기술하였다.

토익 문제 풀이 모델 학습을 위한 유의어/반의어 기반 데이터 증강 기법 (Synonyms/Antonyms-Based Data Augmentation For Training TOEIC Problems Solving Model)

  • 이정우;;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-335
    • /
    • 2023
  • 최근 글을 이해하고 답을 추론하는 연구들이 많이 이루어지고 있으며, 대표적으로 기계 독해 연구가 존재한다. 기계 독해와 관련하여 다양한 데이터셋이 공개되어 있지만, 과거에서부터 현재까지 사람의 영어 능력 평가를 위해 많이 사용되고 있는 토익에 대해서는 공식적으로 공개된 데이터셋도 거의 존재하지 않으며, 이를 위한 연구 또한 활발히 진행되고 있지 않다. 이에 본 연구에서는 현재와 같이 데이터가 부족한 상황에서 기계 독해 모델의 성능을 향상시키기 위한 데이터 증강 기법을 제안하고자 한다. 제안하는 방법은 WordNet을 이용하여 유의어 및 반의어를 기반으로 굉장히 간단하면서도 효율적으로 실제 토익 문제와 유사하게 데이터를 증강하는 것이며, 실험을 통해 해당 방법의 유의미함을 확인하였다. 우리는 본 연구를 통해 토익에 대한 데이터 부족 문제를 해소하고, 사람 수준의 우수한 성능을 얻을 수 있도록 한다.

  • PDF

공공기관 클라우드 데이터 센터에 활용 가능한 공개키 기반의 안전한 데이터 관리 기법 (Public Key based Secure Data Management Scheme for the Cloud Data Centers in Public Institution)

  • 위유경;곽진
    • 디지털융복합연구
    • /
    • 제11권12호
    • /
    • pp.467-477
    • /
    • 2013
  • 클라우드 컴퓨팅 서비스가 대중적으로 보급됨에 따라 공공분야에서 해당 서비스의 도입에 대한 관심이 증가하고 있다. 이에 따라 국내에서는 클라우드 컴퓨팅을 공공분야에 도입하거나 계획하고 있으며 점차 구체적으로 구축하고 있다. 하지만 공공분야에서의 클라우드 도입 및 활성화를 위해서는 서비스 가용성 장애요인 및 인증 받지 않은 사용자의 무단 접근, 불분명한 출처로부터 다운로드 받은 데이터로 인한 클라우드 데이터센터의 신뢰성 저하 등의 보안 위협에 대한 해결방안을 모색할 필요성이 있다. 따라서 본 논문에서는 공공기관 클라우드 데이터센터에서 활용 가능한 공개키 기반의 안전한 데이터 관리 기법에 대해서 제안한다. 이를 통해 공공기관에 클라우드 컴퓨팅을 도입할 때 인증 받은 사용자만 데이터센터를 사용할 수 있고, 공공 데이터의 중요도와 난이도를 공용데이터, 개인데이터, 기밀데이터로 설정해주어 체계적이고 안전하며 효율적으로 데이터 관리를 가능하게 한다. 따라서 공공기관에서의 클라우드 서비스에 대해 전반적인 보안성과 편의성을 향상시킬 수 있을 것으로 기대된다.

Market Research - 전국 커피자판기 설치 현황, 베일을 벗다

  • 한국자동판매기공업협회
    • 벤딩인더스트리
    • /
    • 제10권2호
    • /
    • pp.27-29
    • /
    • 2010
  • "전국에 설치되어 운영 중인 커피자판기가 몇 대가되나요?" 협회로 이런 문의를 하는 전화들이 가끔씩 걸려 온다. 이렇게 외부에서는 실질적으로 자판기 운영대수를 궁금해 하는 경우가 많다. 하지만 협회에서 내는 통계는 매년 생산량기준으로 집계가 되기 때문에 이런 궁금증을 흡족하게 풀어주지 못했다. 실제 운영 중인 커피자판기의 추정대수 정도만을 이야기 할 수 있었지, 객관적인 데이터를 제공하지 못해 왔다. 이 같은 현상은 전국에 산재해 있는 커피자판기들의 대수를 합산하여 통계를 내는 시스템을 구축하기가 힘들기 때문이다. 국내의 경우 전문 운영업자들의 수도 무척 많은 데다가, 거미줄처럼 연계된 개인 운영자까지 포함을 하면 통계 대상이 엄청 광범위해 진다. 따라서 이들을 대상으로 통계 데이터를 합산하는 일은 거의 불가능에 가깝다. 캔음료자판기의 경우는 그래도 대형 음료업체의 수량 데이터를 제공받으면 객관적인 집계가 가능한 점과는 차이가 있다. 이런 탓에 국내는 커피자판기 운영 통계에 대한 갈증이 컸다. 전국에 몇 대 커피자판기가 운영되는지 지역별 분포는 어떻게 되는지 알고자 하는 수요는 많았지만 정보공급자는 없었다. 이러한 현실에서 금호 '마켓 리서치'에서는 운영 통계에 대한 정보갈증을 해소시키는 데이터를 공개한다. 이번에 공개하는 자료는 전국에 영업 신고된 식품자판기의 전체 통계이다. 본지에서 이미 지난 2009년 여름호에 '서울시 영업신고된 식품자판기 운영 현황'을 분석한 기사를 게재하여 큰 반향을 일으킨바 있다. 하지만 이번에 공개되는 데이터는 전국을 대상으로 해 정보가치가 더 크다. 과연 전국에는 몇 대의 식품자판기가 설치되어 있고, 지역별 어떠한 분포와 특징을 나타내고 있는지를 살펴보기로 하자.

  • PDF

에이전트를 이용한 사용자 중심의 개인용 생물학 검색시스템 (User-Centric Personal Biological Retrieval System Using Agents)

  • 김영억;정광수;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2005
  • 생명정보 분야의 발전과 더불어 과거 축적되어 온 방대한 양의 생물학 데이터들이 이질적인 형태로 데이터베이스화 되어있다 특히, 인간게놈프로젝트의 완료 후에 유전자 및 단백질의 기능을 밝히기 위한 지노믹스 및 프로테오믹스 연구가 활발해졌다. 새로운 생물학적 과정을 탐색하기 위해서는 기존에 존재하는 생물학 데이터베이스의 데이터를 수집하기 위한 기술적인 검색 능력이 필요하다. 전산지식이 부족한 대부분의 생물학자들은 공개용 데이터베이스로부터 필요한 정보를 획득하는데 어려움을 격고 있다. 각 분야의 생물학자들이 공개용 데이터베이스로부터 자신의 분야에 관련된 데이터를 검색?추출하는 작업을 수월하게 해 줄 검색 시스템이 필요하다. 따라서, 에이전트를 이용하여 공개용 데이터베이스로부터 정보를 수집하는 사용자 중심의 개인용 검색시스템을 제안하고자 한다. 또한, 검색시스템을 이용하여 생물학자가 지노믹스와 프로테오믹스의 실험적인 접근을 위해 원하는 많은 양의 특정 도메인의 데이터를 검색하고 질의된 결과를 개인 컴퓨터에 2차 데이터베이스를 만들어 저장한다. 사용자에 의해 생성된 특정 분야의 도메인인 2차 데이터베이스를 통해 데이터의 접근의 편리성과 생물학 정보의 분석의 용이성을 얻을 수 있다.

  • PDF

공개 데이터의 프라이버시 안전성: 진료정보 통계자료 HIRA-NPS 2011 사례 분석 (The Privacy Safety of Public Data: A Case Study on Medical Statistics HIRA-NPS 2011)

  • 김수형;정연돈;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.786-789
    • /
    • 2013
  • 개인정보가 포함된 데이터가 많은 기관에서 다양한 목적을 위해 배포되고 있다. 이러한 공개 데이터는 프라이버시 문제를 야기할 수 있기 때문에, 배포에 앞서 항상 데이터에 대한 프라이버시 보호가 고려되어야 한다. 그러나 현재 배포되는 많은 데이터는 충분하지 못한 프라이버시 보호 과정을 거쳐 배포되고 있다. 이 논문에서는 개인정보를 포함하는 데이터의 프라이버시 안전성을 분석한다. 이를 위해 우리는 건강보험심사평가원에서 배포한 2011년 진료정보 통계자료(HIRA-NPS)를 실험에 사용한다. 분석을 위해 기존에 널리 쓰이는 프라이버시 보호 모델 k-익명성(k-anonymity)과 l-다양성(l-diversity)을 차용하여 안전성 판단의 척도를 정의한다. 또한 실제 데이터에 이 척도를 적용하여 프라이버시 안전성을 측정하고, 그 결과가 갖는 의미를 분석한다.

공개암호키를 사용한 센서네트워크에서의 키 분배 구현 (Implementation of Publickey-based Key Distribution in Wireless Sensor Network)

  • 오경희;김태성;김호원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 동계학술대회
    • /
    • pp.95-98
    • /
    • 2008
  • 센서네트워크는 넓은 지역에 무선 인프라로 묶여 설치된 센서들을 사용하여 상황 인지로 감지된 데이터를 응용서비스 서버와 연동하는 기술이다. 이는 환경 감시, 대상 추적, 환자 모니터링, 군사적 목적 등 매우 다양한 분야에 사용될 수 있다. 센서네트워크 역시 기존 네트워크에서 필요로 하는 보안 기능을 요구한다. 그러나 센서네트워크에 사용되는 노드들이 사용할 수 있는 자원에 제약이 있어, 기존의 암호기술을 그대로 적용하는데 어려움이 있다. 이러한 센서네트워크에서의 키 분배 문제를 해결하기 위하여 인증센터를 사용하는 기법, 랜덤 키 사전 분배 기법, q-합성수 랜덤 키 사전 분배 기법, Blom 스킴, 위치 기반 키 사전 분배 기법 등이 제안되어 있다. 한편, 공개키 연산의 많은 부하로 인하여 공개키 기법을 센서네트워크에 적용하기에 적합하지 않으리라 여겨져 왔으나, 최근의 연구결과들에 의하면 PKI처럼 복잡한 시스템을 구현하는 것은 부적합할지라도 공개키를 이용한 키 분배 기법을 센서네트워크에 적용하는 것이 실효성이 있다는 것을 보여준다. 본 논문에서는 TinyOS 플랫폼에서 공개키를 이용하여 센서 노드 간 상호 인증 및 세션키를 생성하여 암호 데이터 통신을 수행하는 센서네트워크 플랫폼을 구현한 결과를 제시한다.

  • PDF