• 제목/요약/키워드: 개인정보 처리

검색결과 2,411건 처리시간 0.073초

준 지도 학습과 커리큘럼 학습을 이용한 유사 기사 추천 모델 (Semi-supervised GPT2 for News Article Recommendation with Curriculum Learning)

  • 서재형;오동석;어수경;박성진;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-500
    • /
    • 2020
  • 뉴스 기사는 반드시 객관적이고 넓은 시각으로 정보를 전달하지 않는다. 따라서 뉴스 기사를 기존의 추천 시스템과 같이 개인의 관심사나 사적 정보를 바탕으로 선별적으로 추천하는 것은 바람직하지 않다. 본 논문에서는 최대한 객관적으로 다양한 시각에서 비슷한 사건과 인물에 대해서 판단할 수 있도록 유사도 기반의 기사 추천 모델을 제시한다. 길이가 긴 문서 사이의 유사도를 측정하기 위해 GPT2 [1]언어 모델을 활용했다. 이 과정에서 단방향 디코더 모델인 GPT2 [1]의 단점을 추가 학습으로 개선했으며, 저장 공간의 효율과 핵심 문단 추출을 위해 BM25 [2]함수를 사용했다. 그리고 준 지도 학습 [3]을 통해 유사도 레이블링이 되어있지 않은 최신 뉴스 기사에 대해서도 자가 학습을 진행했으며, 이와 함께 길이가 긴 문단에 대해서도 효과적으로 학습할 수 있도록 문장 길이를 기준으로 3개의 단계로 나누어진 커리큘럼 학습 [4]방식을 적용했다.

  • PDF

복합잡음 환경에서 Lagrange 보간법을 이용한 영상복원 알고리즘 (Image Restoration Algorithm using Lagrange Interpolation in Mixed Noise Environments)

  • 권세익;김남호
    • 한국정보통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.455-462
    • /
    • 2015
  • 최근, 영상 매체는 멀티미디어의 핵심 서비스의 일환으로 인터넷, 컴퓨터, 디지털 카메라 등에 활용되고 있다. 디지털 가전과 개인 컴퓨터의 응용 소프트웨어의 발달로 디지털 영상은 쉽게 획득하고 처리할 수 있게 되었다. 그러나 디지털 영상을 획득, 처리, 전송하는 과정에서 여러 외부 원인에 의해 영상의 열화가 발생되며, 영상 열화의 주된 원인은 잡음에 의한 것으로 알려져 있다. 따라서 본 논문에서는 복합잡음을 제거하기 위해 잡음 판단 후, 임펄스 잡음은 Lagrange 보간법, 가우시안 잡음은 거리에 따른 공간가중치를 적용하여 처리하는 영상복원 필터 알고리즘을 제안하여 시뮬레이션하였다. 제안한 알고리즘은 임펄스 잡음(P=60%) 및 가우시안 잡음(${\sigma}=10$)에 훼손된 Girl 영상을 적용하여 처리한 결과, 기존의 A-TMF, AWMF, MMF에 비해 각각 8.77[dB], 8.83[dB], 10.02[dB] 개선되었다.

광학문자인식 기반 보안문서 이미지 파일 관리 시스템 (Optical Character Recognition based Security Document Image File Management System)

  • 정필성;조양현
    • 한국융합학회논문지
    • /
    • 제10권3호
    • /
    • pp.7-14
    • /
    • 2019
  • 정보통신 기술의 발전으로 우리는 사무실에서 개인용 컴퓨터를 이용한 방식의 회사업무처리에서 벗어나 스마트 기기를 이용하여 언제 어디서나 편리하게 업무를 처리하는 스마트워크 환경을 경험하고 있다. 오피스 프로그램을 이용하여 작성한 문서를 이메일 서비스를 이용하여 주고받던 것을 스마트 기기를 이용하여 사진을 찍고 모바일 메신저로 전송하는 것으로 대신할 수 있다. 제조현장에서는 보안문서인 작업지시서를 스마트 기기를 이용하여 사진을 찍고 공유하는 것을 쉽게 볼 수 있다. 본 논문에서는 제조현장에서 근로자의 스마트 기기에 남겨지는 보안문서 이미지 파일을 찾아내고 삭제 처리하는 시스템을 제안한다. 제안한 시스템은 광학문자인식 기술을 이용하여 이미지의 글씨를 인식한 후 키워드화 시켜 일치하는 비율을 통해 보안문서 이미지 파일을 검색해내고 삭제 처리한다. 본 논문에서 제안한 시스템을 이용할 경우 중소기업에서도 효율성 높은 시스템을 구축하여 보안인식이 낮은 제조현장의 작업자들도 편리하게 보안문서 파일을 관리할 수 있다.

개인화된 건강 데이터의 대량 처리 모니터링을 위한 메시지 모델 및 동적 버퍼 할당 설계 (Design of Dynamic Buffer Assignment and Message model for Large-scale Process Monitoring of Personalized Health Data)

  • 전영준;황희정
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.187-193
    • /
    • 2015
  • ICT 힐링플랫폼은 만성질환 예방을 목적으로 하며 개인의 생체신호 및 생황습관 등의 정보에 기반을 둔 질환 조기 경보를 목표로 한다. 이를 위한 2-step 개방형 시스템(TOS)에는 힐링플랫폼과 개인건강데이터 저장소간의 중계가 설계되었으며 데이터 처리과정을 실시간으로 전송(모니터링)하기 위한 대량 커넥션 기반의 publish/subscribe(pub/sub) 서비스가 고려되었다. 그러나 TOS pub/sub의 초기 설계에서는 커넥션 메시지를 deflate 알고리즘으로 인코딩하기 위해, 커넥션의 유휴(idle) 여부 및 메시지의 종류에 상관없이 동일한 버퍼를 할당한다. 본 논문의 동적 버퍼 할당은 다음과 수행된다. 우선 각 커넥션의 메시지 전송 유형을 큐잉하고, 각 큐는 tf-idf를 통해 특징(feature)추출 연산 후 벡터로 변환하여 k-means 클러스터에 입력하여 군집을 생성한다. 특정 군집으로 분류된 커넥션은 해당 군집의 자원 테이블에 따라 자원을 재할당 한다. 이때 각 군집의 센트로이드(centroid)는 해당 군집을 대표하는 큐잉 패턴을 사전에 선택하여 자원참조 테이블(버퍼 크기별 인코딩 효율)로 도출한다. 제안된 설계는 TOS의 인코딩 버퍼 자원을 네트워크 커넥션에 효율적으로 배분하기 위해, 군집 및 특징 연산을 위한 연산 자원과 네트워크 대역폭 간의 trade-off를 수행함으로써 TOS의 tps(단위 시간당 실시간 데이터 처리 모니터링 연결수)를 높이는데 활용할 수 있다.

관절질환 관리를 위한 Mask R-CNN을 이용한 모션 모니터링 (Motion Monitoring using Mask R-CNN for Articulation Disease Management)

  • 박성수;백지원;조선문;정경용
    • 한국융합학회논문지
    • /
    • 제10권3호
    • /
    • pp.1-6
    • /
    • 2019
  • 현대사회는 생활과 개성이 중요시 되면서 개인화된 생활습관 및 패턴이 생기고 있으며, 잘못된 생활습관으로 인해 관절질환자가 증가하고 있다. 또한 1인 가구가 점점 증가하면서 응급상황이 발생할 경우 알맞은 시간에 응급처치를 받지 못하는 경우가 생긴다. 건강과 질병관리에 필요한 개인의 상태에 따른 정확한 분석을 통해 스스로 관리할 수 있는 정보와 응급상황에 맞는 케어가 필요하다. 딥러닝 중에서 CNN은 데이터의 분류 및 예측에 효율적으로 사용된다. CNN은 데이터 특징에 따라 정확도 및 처리 속도에 차이를 보인다. 따라서 실시간 헬스케어를 위해 처리속도 향상과 정확도 개선이 필요하다. 본 논문에서는 관절질환 관리를 위한 Mask R-CNN을 이용한 모션 모니터링을 제안한다. 제안하는 방법은 Mask R-CNN을 이용하여 CNN의 정확도와 처리 속도를 개선하는 방법이다. 사용자의 모션을 신경망에 학습시킨 후 사용자의 모션이 학습된 데이터와 차이가 있을 경우 사용자에게 관리법을 피드백 해주고 보호자에게 응급상황을 알릴 수 있으며 상황에 맞는 적절한 조치를 취할 수 있다.

텍스트 마이닝 기반의 온라인 상품 리뷰 추출을 통한 목적별 맞춤화 정보 도출 방법론 연구 (A Study on the Method for Extracting the Purpose-Specific Customized Information from Online Product Reviews based on Text Mining)

  • 김주영;김동수
    • 한국전자거래학회지
    • /
    • 제21권2호
    • /
    • pp.151-161
    • /
    • 2016
  • 개방, 공유, 참여를 특징으로 하는 웹 2.0 시대로 들어서면서 인터넷 사용자들의 데이터 생산 및 공유가 쉬워졌다. 이에 따른 데이터의 기하급수적인 증가와 함께 디지털 정보의 대부분인 비정형적 데이터(Unstructured Data)의 양도 증가하고 있다. 인터넷에서 정해진 형식 없이 자연어 형태로 만들어진 비정형 데이터 중, 특정 상품들에 대해 개인이 평가한 리뷰들은 해당 기업이나 해당 상품에 관심이 있는 잠재적 고객에게 필요한 데이터이다. 많은 양의 리뷰 데이터에서 상품에 대한 유용한 정보를 얻기 위해서는 데이터 수집, 저장, 전처리, 분석, 및 결론 도출의 과정이 필요하다. 따라서 본 연구는 R을 이용한 텍스트 마이닝(Text Mining) 기법을 사용하여 텍스트 형식의 비정형 데이터에서 자연어 처리 기술 및 문서 처리 기술을 적용하여 정형화된 데이터 값을 도출하는 방법에 대해 소개한다. 또한, 도출된 정형화된 리뷰 정보를 데이터 마이닝 기법에 적용하여 목적에 맞게 맞춤화된 리뷰 정보를 도출시키는 방안을 제시하고자 한다.

XML 템플릿 기반 지식베이스 관리 기법과 그 응용 (A Knowledge Base Management Technique Based on XML Templates and its Application)

  • 이혜자;정병수;박승훈
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1527-1536
    • /
    • 2004
  • 전문가의 지식을 다양하고 효율적으로 활용하기 위해서는 복잡한 지식을 구조적으로 표현하고 변화에 유연하게 적응하도록 관리하는 것이 무엇보다도 중요하다. 본 논문에서는 XML 템플릿(template)을 기반으로 한 지식베이스 관리 방법을 제안한다. 제안하는 방법에서는 복잡하고 다양한 정보를 구조적으로 표현하는데 효과적인 XML을 이용하면서, XML 문서의 종류와 개수가 많아지면서 발생하는 문서관리상의 비효율성 문제를 해결하기 위하여, 복잡한 지식을 XML로 표현된 다수의 탬플릿으로 분류하여 작성하고, XML 템플릿들 사이의 연관관계 등을 정의한 메타템플릿을 이용하여 구조적으로 관리한다. 제안한 방법의 효용성을 입증하기 위해 개인의 건강과 체력에 적합한 운동을 처방하는 데 필요한 지식베이스와 운동처방 프로세스 중 대상자의 체력유형을 분류하는 프로그램을 개발하고 그 결과를 분석하였다. 실험을 통해 본 논문에서 제안하는 XML 템플릿 기반 지식베이스 관리 방법은 복잡한 전문지식을 구조적으로 표현하고, 새로운 유형의 정보가 필요하거나 기존 정보의 변경이 필요할 경우 유연하게 대처할 수 있으며, 메타템플릿을 이용하여 XML 템플릿들을 구조적으로 관리함으로써 효율적으로 추론할 수 있음이 확인되었다.

위치기반 Two-Factor L-OTP 프로토콜 (A Location based Two-Factor L-OTP Protocol)

  • 서화정;김호원
    • 정보처리학회논문지C
    • /
    • 제18C권5호
    • /
    • pp.327-330
    • /
    • 2011
  • 기존 휴대폰에 비해 강력한 연산능력을 가진 스마트폰의 출시 이후 개인 컴퓨터에서 제공되던 온라인 서비스의 영역이 점차 스마트폰으로 확산되고 있는 추세이다. 이러한 기술의 발전은 사용자에게 서비스제공의 시간 및 공간적 제한을 없애 주었지만, 악의적 공격에 쉽게 노출되는 보안상의 취약점을 가진다. 특히 금융권 서비스 이용 시 사용자의 비밀 정보가 교환되므로 더욱 주의를 기울여야 한다. 이러한 보안 문제를 해결하기 위해서는 하나의 세션에 하나의 비밀 키만을 사용하는 OTP(One Time Pad)가 권장되고 있다. 지금까지 스마트 폰에서의 OTP기법들은 기존 환경에 초점을 맞추어 제안 및 구현되어 왔다. 하지만 모바일 환경에서의 보안은 기존 시스템에 비해 공격에 취약할 뿐 아니라 자원적인 한계점을 가진다. 따라서 스마트폰에 적합한 새로운 개념의 OTP의 도입이 요구되어 진다. 본 논문에서는 시간동기화를 통한 T-OTP(Time One Time Pad) 기법과 위치기반 정보를 접목한 L-OTP(Location-OTP) 프로토콜을 제시한다. 제안된 방식은 스마트폰에서 사용자가 가지는 유일한 위치정보를 통해 OTP를 생성한다.

뇌파측정기술을 활용한 언어 기반 사운드 요약의 생성 방안 연구 (Towards the Generation of Language-based Sound Summaries Using Electroencephalogram Measurements)

  • 김현희;김용호
    • 정보관리학회지
    • /
    • 제36권3호
    • /
    • pp.131-148
    • /
    • 2019
  • 본 연구는 시청자가 사운드 자료의 주제를 파악하는 과정과 사운드의 특성을 이해하기 위한 인지적 정보처리 모형을 구성하였다. 이후 사건관련유발전위(event related potentials, ERP)의 두뇌의 전후측에 걸쳐서 발현하는 N400, P600 구성요소들을 인지적 정보처리 모형의 언어적 표상에 접목시켜 사운드 요약을 생성하는 방안을 제안하기 위해서 연구 가설들을 수립하였다. 뇌파 실험을 통해서 연구 가설들을 검증한 결과, P600이 사운드 요약의 핵심 구성 요소로 나타났다. 본 연구 결과는 분류 알고리즘 설계에 적용되어 내용 기반 메타데이터 즉, 일반적인 또는 개인화된 미디어 요약(사운드 요약, 비디오 스킴)을 생성하는 데에 활용될 수 있을 것이다.

스마트폰 사용자의 멀티태스킹 행동이 스마트폰 중독에 미치는 영향에 관한 연구 (A Study on the Impacts of Multitasking Behaviors on Smartphone Addiction)

  • 변혜선;한동균;이선로
    • 정보화정책
    • /
    • 제21권4호
    • /
    • pp.59-80
    • /
    • 2014
  • 스마트폰에 대한 관심과 사용이 집중되면서 사용 범위 또한 점차 넓어져 공적 업무처리 이외에 사적 업무처리와 동시에 사회 연결망 확장에도 사용되고 있다. 최근 스마트폰의 다양한 기능들은 사용자로 하여금 스마트폰을 사용하면서 동시에 다른 활동도 함께하는 멀티태스킹 행동을 유발하며, 스마트폰 사용에 집중하고 몰입하여 결국 사용자가 스마트폰을 사용하지 않으면 불안해지는 중독현상까지 나타내고 있다. 이에 본 연구에서는 개인적 특성이 스마트폰의 멀티태스킹 행동에 어떠한 영향을 미치는지 파악하고자 하였으며, 멀티태스킹 행동, 만족, 몰입 및 중독 간에 미치는 영향 관계에 대해 알아보고자 하였다. 선행 연구를 바탕으로 개인 특성 요인을 복합시간성, 혁신성, 자기효능감으로 설정하고 이러한 요인이 멀티태스킹 행동에 미치는 영향과 멀티태스킹 행동, 만족, 몰입 및 중독에 미치는 영향을 살펴보았다. 연구결과, 스마트폰 사용자의 복합시간성은 멀티태스킹 행동에 영향을 주는 것으로 나타났으나, 혁신성과 자기 효능감은 멀티태스킹 행동에 영향을 주지 않는 것으로 나타났다. 또한, 멀티태스킹 행동은 만족, 몰입 및 중독에 모두 긍정적인 영향을 미치는 것으로 조사되었으며, 만족은 중독에 영향을 주지 않지만, 몰입에 긍정적인 영향을 주는 것으로 나타났다. 마지막으로 몰입은 중독에 긍정적인 영향을 미치는 것으로 나타났다. 따라서 사용자의 멀티태스킹 행동은 중독에 직접적으로, 또는 몰입을 통하여 간접적으로 영향을 미치고 있는 것으로 나타났다.