• 제목/요약/키워드: 데이터 분석론

검색결과 1,370건 처리시간 0.034초

SCADA 시스템에서 XML 기반의 데이터 매핑 방법론 연구 (A study on XML based methodology of data mapping for SCADA System)

  • 주승환;이재경;박준영;이준신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.711-713
    • /
    • 2013
  • 본 연구의 목적은 SCADA 시스템을 이용하여 전력, 발전설비, 송유시설, 가스처리, 도로교통, 폐수처리 등 사회인프라 구조물에 대한 능동적 재난관리 및 방지 방법론을 개발하는 것이다. SCADA 시스템은 원격으로 제어기능을 수행하고, 운영 성능 분석 및 보고하기 위한 컴퓨팅 시스템이다. 여러 제작사의 이기종 설비 시스템들을 단일 SCADA 시스템에서 관리하기 위해서는 이기종간의 데이터 호환과 정보 수집의 일반화가 필요하며, 본 연구에서는 이를 XML 기반의 데이터 통신을 통해 해결하고자 하였다. 본 연구에서는 해상풍력발전 설비의 이기종간 데이터 일반화를 목표로 하였고, 나아가 발전 설비 외에도 이기종 단말의 데이터 동기화가 필요한 경우에 XML을 이용한 이기종 단말의 데이터 수집 방법론을 활용할 수 있을 것이다.

RNA-Seq 데이터를 이용한 전사체 분석 도구 (A Transcriptome Analysis Tool using RNA-Seq Data)

  • 공진화;신재문;원정임;이은주;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.113-115
    • /
    • 2012
  • 전사체(transcriptome) 분석이란 주어진 조건 하에서 현재 세포 내에 발현된 모든 트랜스크립트의 종류와 양을 밝히는 것을 의미하며, 분석 결과는 질병 관련성/유전적 요인 규명 등의 연구에 직접 활용한다. 우리는 선행 연구에서 RNA-Seq 데이터를 이용하여 선택 스플라이싱 과정에 의하여 생성되는 모든 트랜스크립트의 유형을 분류/추출하는 새로운 방법론을 제안한 바 있다. 그 후속 연구로서 본 연구에서는 시간/공간 효율적인 알고리즘 구현을 위한 최적화 방법론을 제안하고, 실용화를 위한 전사체 분석 도구 개발에 대하여 논한다. 개발된 전사체 분석 도구에서는 기존의 분석 도구와 달리 RNA-Seq 데이터의 단계적 분석 결과를 시각적 뷰어를 통하여 검색 가능하며, 이들 기능은 복잡한 전사체 분석 결과의 이해와 타당성 검증에 활용한다.

시스템 요구사항 분석을 위한 순환적-점진적 복합 분석방법 (An Integrated Method of Iterative and Incremental Requirement Analysis for Large-Scale Systems)

  • 박지성;이재호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권4호
    • /
    • pp.193-202
    • /
    • 2017
  • 인공지능 기반 지능형 시스템의 개발에는 일반적으로 신뢰성 높은 대규모 지식처리, 지식의 통합과 인간 수준의 이해, 지식기반 인간-기계협업, 전문가 수준의 지능 서비스 등의 효과적 통합이 요구된다. 특히 빅데이터 이해 기반 자가학습형 지식베이스 및 추론 기술 개발을 목표로 하고 있는 과제의 일환으로 개발 중인 WiseKB 통합 플랫폼은 대용량 지식을 저장하여 추론과정을 통한 질의 및 응답이 가능한 대규모 지식 베이스 역할을 수행하며 이를 위하여 지식표현, 자원통합, 지식저장소, 지식베이스, 복합추론, 지식학습 등의 요소기술들의 효과적 통합이 필수적이다. 통합 플랫폼의 효율적 통합을 위해서는 정확한 요구사항 분석이 중요하며, 이는 시스템의 특성을 고려한 적절한 요구사항 분석 방법론의 적용이 필요하다. 대표적인 요구사항 분석 방법인 순차적 방법론과 순환-점진적 방법론은 WiseKB와 같은 시스템의 대규모 복합적 개발 특성을 고려할 때 다양한 요구사항을 체계적으로 파악하기에 한계가 있다. 본 논문에서는 이러한 한계를 개선하고자 순차적 방법과 순환-점진적 방법론을 결합해 각 단점을 보완하고 대규모 복합적 특성을 갖는 시스템의 요구사항 분석을 효율적으로 진행할 수 있는 통합 방법론을 제시하고, 실제 적용을 통해 그 효과를 보인다.

프롬프트 튜닝기법을 적용한 한국어 속성기반 감정분석 (Prompt Tuning For Korean Aspect-Based Sentiment Analysis)

  • 김봉수;전현규;최승호;김지윤;장정훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.50-55
    • /
    • 2023
  • 속성 기반 감정 분석은 텍스트 내에서 감정과 해당 감정이 특정 속성, 예를 들어 제품의 특성이나 서비스의 특징에 어떻게 연결되는지를 분석하는 태스크이다. 본 논문에서는 속성 기반 감정 분석 데이터를 사용한 다중 작업-토큰 레이블링 문제에 프롬프트 튜닝 기법을 적용하기 위한 포괄적인 방법론을 소개한다. 이러한 방법론에는 토큰 레이블링 문제를 시퀀스 레이블링 문제로 일반화하기 위한 감정 표현 영역 검출 파이프라인이 포함된다. 또한 분리된 시퀀스들을 속성과 감정에 대해 분류 하기 위한 템플릿을 선정하고, 데이터셋 특성에 맞는 레이블 워드를 확장하는 방법을 제안함으써 모델의 성능을 최적화한다. 최종적으로, 퓨샷 세팅에서의 속성 기반 감정 분석 태스크에 대한 몇 가지 실험 결과와 분석을 제공한다. 구축된 데이터와 베이스라인 모델은 AIHUB(www.aihub.or.kr)에 공개되어 있다.

  • PDF

MLM 기반 언어 간 전이학습을 이용한 개체명 인식 방법론 분석 (An Analysis of Named Entity Recognition System using MLM-based Language Transfer Learning)

  • 손준영;김경민;김진성;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.284-288
    • /
    • 2022
  • 최근 다양한 언어모델의 구축 및 발전으로 개체명 인식 시스템의 성능은 최고 수준에 도달했다. 하지만 이와 관련된 대부분의 연구는 데이터가 충분한 언어에 대해서만 다루기 때문에, 양질의 지도학습 데이터의 존재를 가정한다. 대부분의 언어에서는 개체 유형에 대한 언어의 잠재적 특성을 충분히 학습할 수 있는 지도학습 데이터가 부족하기 때문에, 종종 자원 부족의 어려움에 직면한다. 본 논문에서는 Masked language modeling 기반 언어 간 전이학습을 이용한 개체명 인식 방법론에 대한 분석을 수행한다. 이를 위해 전이를 수행하는 소스 언어는 고자원 언어로 가정하며, 전이를 받는 타겟 언어는 저자원 언어로 가정한다. 본 논문에서는 언어모델의 토큰 사전에 언어 독립적인 가상의 자질인 개체 유형에 대한 프롬프트 토큰을 추가하고 이를 소스 언어로 학습한 뒤, 타겟 언어로 전이하는 상황에서 제안하는 방법론에 대한 평가를 수행한다. 실험 결과, 제안하는 방법론은 일반적인 미세조정 방법론보다 높은 성능을 보였으며, 한국어에서 가장 큰 영향을 받은 타겟 언어는 네덜란드어, 한국어로 전이할 때 가장 큰 영향을 준 소스 언어는 중국어인 결과를 보였다.

  • PDF

리눅스 체계의 웹기반 의료정보 시스템 개발 (Development a Web-based Medical Information System on Linux)

  • 권수용;주경수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.241-244
    • /
    • 2007
  • 최근 개발되어지는 많은 어플리케이션 프로그램들은 전 세계 어디서든 접근할 수 있도록 웹 어플리케이션 프로그램으로 개발되어지고 있으며, 개발된 프로그램들은 효율적인 유지, 보수, 및 추후 발생되는 요구사항에 따르는 기능추가를 위해 객체지향적 개발 방법론을 사용하여야 한다. 또한 안정된 웹어플리케이션과 데이터들의 처리 및 동작을 위해서 서버로서의 기능은 Microsoft사의 Windows 체계가 아닌 Unix 기반의 운영체제를 사용하여 각 데이터들을 관계를 고려한 관계형 데이터베이스로서 처리해야 할 것이다. 따라서 본 논문에서는 Unix 계열 서버 운영체제인 Linux에서 객체지향 설계 방법론인 UML을 통한 웹 어플리케이션 분석 설계와 관계형 데이터베이스 설계 방법론인 E-R 데이터 베이스 설계를 통한 시스템 분석 설계를 것을 제시한다.

  • PDF

애자일 방법론을 사용한 소프트웨어 프로젝트에서의 사용자 역할 분석 (The Role of Clients in Software Projects with Agile Methods)

  • 김블라디미르;조우제;정윤혁
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.141-160
    • /
    • 2019
  • 애자일 방법론은 인공지능 소프트웨어를 포함한 소프트웨어 개발 프로젝트에서 지난 몇 년 동안 널리 사용되고 있다. 이처럼 산업에서 애자일 방법론이 많이 사용되고 있음에도 불구하고, 애자일 방법론을 사용하는 소프트웨어 프로젝트의 성공 요인을 분석한 실증적 연구가 부족한 실정이다. 애자일 방법론을 사용하는 소프트웨어 프로젝트에서 고객의 역할을 이해하기 위해 사용자 참여 부족, 비현실적인 고객 기대치, 지속적인 요구 사항 변경의 고객 측 요인들이 프로젝트 성공에 미치는 영향을 조사하였다. 본 연구의 분석 대상은 애자일 방법을 소프트웨어 개발 방법론으로 사용하는 프로젝트이다. 일반적으로 소프트웨어 개발에서의 주 목표는 적은 시간과 비용으로 고품질 소프트웨어를 개발하는 것이다. 과거에는 프로젝트의 초기 단계에서 정한 고객 요구사항의 변화를 최소화하여, 그 변화에 수반되는 비용을 줄이려고 했다면, 오늘날의 프로젝트 관리에서 고객 요구사항의 변화는 고객이 원하는 시스템 개발을 위해 필수적인 것이라 인정하고 이 불가피한 변화에 보다 잘 대응하는 것이 중요하다고 볼 수 있다. 이에 효과적인 방법론으로 애자일 방법론이 많이 사용되고 있고, 본 연구에서는 이 애자일 방법론을 사용하는 프로젝트의 성공요인을 찾아내고자 한다. 본 연구를 위해 설문 방법이 이용되었다. 소셜 네트워크 사이트인 링크드인(LinkedIn)을 이용하여 소프트웨어 프로젝트 참여 경험이 있는 개발자들을 대상으로 온라인 설문을 하였고, 분석에 사용한 데이터는 213개의 응답 데이터이다. 이 설문 응답 데이터를 Ordered Logit Regression을 이용하여 세 가지 가설을 검증하였다. 분석 결과, 위 세 가지 클라이언트 측 요인들 모두가 애자일 방법을 사용하는 프로젝트의 성공에 크게 영향을 미친다는 사실을 실증적으로 찾아내었다. 첫째, 애자일 방법을 이용하기 위해서는 고객의 프로젝트 참여가 필수적이다. 이 결과는 애자일 방법론의 이론적 효과와 일치한다. 사용자와의 협업이 애자일 방법론에서 가장 중요한 요소 중에 하나인 만큼 고객의 참여는 매우 중요하다고 볼 수 있다. 둘째, 애자일 방법이 사용된 프로젝트에서는 고객의 요구 사항을 지속적으로 변경하는 것이 부정적인 요인이 아니라 프로젝트 성공의 긍정적인 요인이라는 흥미로운 결과를 얻었다. 고객의 요구 사항을 지속적으로 변경하는 것은 클라이언트와 공급 업체 간의 빈번한 상호 작용이나 의사 소통을 통해 사용자가 진정으로 원하는 시스템을 만드는데 도움이 되어 긍정적인 요인이 된다는 설명이 가능하다. 셋째, 비현실적인 고객의 기대는 애자일 방법이 사용된 프로젝트에서도 프로젝트 성공에 부정적인 영향을 준다는 결과를 얻었다.

공공데이터 기반 고용보험 가입 예측 모델 개발 연구 (A Development on a Predictive Model for Buying Unemployment Insurance Program Based on Public Data)

  • 조민수;김도현;송민석;김광용;정충식;김기대
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.17-31
    • /
    • 2017
  • 빅데이터의 중요성이 증가함에 따라 공공기관에서는 다양한 빅데이터 관련 인프라를 제공하고 있으며, 그 중 하나가 공공데이터이다. 공공데이터 기반의 다양한 활용 사례가 공유되고 있으며, 공공기관에서도 데이터 기반의 모델을 통해 공공의 문제를 해결하려는 움직임을 보이고 있다. 대표적으로 사회 보험 중 하나인 고용보험 케이스가 있다. 고용보험은 근로자의 권익 보호를 위해 근로자를 고용한 모든 사업주가 필수적으로 가입하여야 하는 보험이지만 가입누락의 경우가 많다. 가입누락을 막기 위한 데이터 기반의 접근이 필요하지만, 분산된 형태의 공공데이터, 수집 시기의 차이로 인해 데이터 통합이 어렵고, 체계적인 방법론이 부재한 상황이다. 본 논문에서는 공공데이터를 기반의 고용보험 가입 예측을 위한 모델 도출방법론을 제시하고자 한다. 본 방법론은 데이터 수집, 데이터 통합 및 전처리, 데이터 탐색 및 이력 데이터 분석, 예측 모델 도출을 포함하며, 프로세스 마이닝 및 데이터 마이닝을 활용한다. 또한, 사례 연구를 통해 본 방법론의 유효성을 검증한다.

  • PDF

공간데이터 표준구축공정의 관리방법론 연구 (A Study on the Process management Methodology of Spatial Database Standard Construction)

  • 최병길;나영우
    • 한국측량학회지
    • /
    • 제27권3호
    • /
    • pp.331-345
    • /
    • 2009
  • 본 연구의 목적은 공간데이터 구축공정에 표준으로 적용 가능한 관리방법론을 연구하는데 있다. 우리나라는 아직까지 구축공정 및 품질관리에 대한 체계적인 기준인 정립되지 않은 실정이어서 국가예산이 낭비될 우려의 소지가 있다. 또한 현재 공간데이터 구축과 관련된 법규는 기준이 명확하지 않은 경우가 있어서 공간데이터의 품질에 대한 신뢰성이 부족한 실정이다. 공간데이터의 제작 및 품질검사와 관련이 있는 법규, 국토지리정보원에서 수행한 공간데이터의 품질관련 연구 등 각종 문헌자료, 지방자치단체의 지리정보시스템을 구축한 경험이 있는 주요 업체의 공간데이터 제작공정 및 작업방법에 대하여 조사, 분석하였다. 분석한 내용을 기반으로 GPS에 의한 기준점 측량, 수준측량, 항공사진촬영, 수치지도 제작, 지형도 제작, 수치표고자료 제작, 항공사진 DB 구축, 정사영상지도 제작 등 8개 사업을 대상으로 선정하고 표준화된 관리방법론을 제시하였다.