• 제목/요약/키워드: 비개인화

검색결과 633건 처리시간 0.037초

개인정보 비식별화를 위한 개체명 유형 재정의와 학습데이터 생성 방법 (Re-defining Named Entity Type for Personal Information De-identification and A Generation method of Training Data)

  • 최재훈;조상현;김민호;권혁철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.206-208
    • /
    • 2022
  • 최근 빅데이터 산업이 큰 폭으로 발전하는 만큼 개인정보 유출로 인한 사생활 침해 문제의 관심도 높아졌다. 자연어 처리 분야에서는 이를 개체명 인식을 통해 자동화하려는 시도들이 있었다. 본 논문에서는 한국어 위키피디아 문서의 본문에서 비식별화 정보를 지닌 문장을 식별해 반자동으로 개체명 인식 데이터를 구축한다. 이는 범용적인 개체명 인식 데이터에 반해 비식별화 대상이 아닌 정보에 대해 학습되는 비용을 줄일 수 있다. 또한, 비식별화 정보를 분류하기 위해 규칙 및 통계 기반의 추가적인 시스템을 최소화할 수 있는 장점을 가진다. 본 논문에서 제안하는 개체명 인식 데이터는 총 12개의 범주로 분류하며 의료 기록, 가족 관계와 같은 비식별화 대상이 되는 정보를 포함한다. 생성된 데이터셋을 이용한 실험에서 KoELECTRA는 0.87796, RoBERTa는 0.88575의 성능을 보였다.

  • PDF

스마트 홈 환경에서의 개인화된 서비스를 위한 사용자 프로파일 관리 기법 (User Profile Management for Personalized Services in smart home environment)

  • 서영정;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.672-677
    • /
    • 2006
  • 유비쿼터스 컴퓨팅 환경에서 상황 인지 서비스 제공을 위한 프레임워크들은 환경에 있는 응용 서비스들로 하여금 사용자 행동 패턴을 지속적으로 모니터링하며, 하나의 중앙집중식 서버에서 축적된 사용자 프로파일을 관리하도록 개발되어 왔다. 그러나, 전체 환경이 사용자 개개인의 서비스에 대한 요구 및 선호도를 파악하고 관리하는 일은 비효율적이다. 그리하여, 사용자 프로파일 관리 서버를 사용하지 않고 개인화된 서비스를 제공하기 위하여 휴대용 정보 단말기가 직접 사용자의 서비스에 대한 선호도를 인식하고 관리하는 사용자 프로파일 관리 프레임워크를 제안한다. 스마트 홈 환경의 이동형 사용자의 컨텍스트 인식을 위해서는 사용자 몸에 부착되어 있는 센서들이 사용자에 대한 정보를 휴대용 정보 단말기로 전달하며, 각 정보 단말기는 다양한 센서들로부터 획득한 정보와 정보단말기를 통해 제공되는 사용자의 직접적인 요구정보를 서비스 목적에 맞게 재해석하여 사용자 선호도에 맞는 서비스 내용을 제공하도록 하는 것이다. 제안된 프레임워크는 휴대용 정보 단말기를 통해 사용자와 환경과의 상호작용을 필요로 하는 유비쿼터스 기술이 활용 가능한 다양한 어플리케이션에 광범위하게 활용될 수 있다. 더 나아가, 사용자의 사적인 정보 보호를 보장하면서 개인화된 서비스 제공을 가능하게 할 수 있다.

  • PDF

도메인 온톨로지를 이용한 개인화된 개념기반 검색 기법 (A Personalized Concept-based Retrieval Technique Using Domain Ontology)

  • 문현정;이수진;김영지;우용태
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.269-282
    • /
    • 2007
  • 본 논문에서는 도메인 온톨로지를 사용하여 개인화 된 개념 기반의 검색 기법을 제안하였다. 제안 모델은 도메인 온톨로지를 이용한 컨텐츠의 대표 개념 추출, 컨텐츠 가중치와 개념 가중치를 이용한사용자 프로파일 구성 그리고 개인화 된 개념 기반 검색 과정으로 구성된다. 컨텐츠의 대표 개념은 TScore 기법을 이용하여 추출하였고, 사용자 프로파일은 개인 정보 수집 모듈을 통해 개념 가중치가 높은 개념을 대상으로 구성하였다. 개념 기반 검색을 위해 사용자 프로파일의 개념 집합과 컨텐츠의 대표 개념 집합간에 유사도를 비교하여 개인이 선호하는 개념의 우선순위에 의해 컨텐츠를 검색하였다. 본 논문에서 제안한 기법의 효율성을 검증하기 위하여 인터넷 사이트에서 컨텐츠를수집하고사용자프로파일을구성하여 실험하였다. 실험 결과, 제안한 검색기법이 기존의 기반의 검색 기법에 비해 우수함을 보였다. 제안된 기법은 개인화 된 추천 시스템이나 전자 도서관 등과 같은 분야에서 효율적으로 적용할 수 있으리라 기대된다.

  • PDF

문서 특성에 대한 선호도 기반 웹 검색 개인화 (Web Search Personalization based on Preferences for Page Features)

  • 이수정
    • 정보교육학회논문지
    • /
    • 제15권2호
    • /
    • pp.219-226
    • /
    • 2011
  • 웹 상에서 사용자가 원하는 정보를 효율적으로 검색하는데 도움을 주기 위하여 웹 개인화는 사용자에게 흥미있는 웹 문서들을 추출해내는데 초점을 두고 있다. 이를 실현하기 위한 주요 방법들 중 하나는 문서에 포함된 질의어, 링크 및 사용자의 선호어를 이용하는 것이다. 본 연구에서는 이들 요소 외에 사용자들이 웹문서를 선택할 때 중요하게 생각하는 문서 특성들을 설문을 통하여 조사하였다. 설문 결과 문서의 내용이 가장 중요한 특성이었으나, 일부 사용자들에게는 문서에 포함된 이미지와 가독성도 내용과 마찬가지로 중요하게 간주되었다. 이를 바탕으로 각 사용자를 위한 문서의 주요 특성들의 상대적 가중치를 프로필에 유지 관리하고, 검색 결과의 개인화에 반영하는 방안을 제시한다. 제안한 개인화 방법의 성능을 분석한 결과, 일반 검색 엔진에 비해 최대 약 2.3배의 성능 향상을 보였고, 사용자 질의어와 선호어를 모두 이용하여 검색 결과를 산출하는 방법보다 약 1.5배의 성능 향상을 나타내어 그 우수성을 입증하였다.

  • PDF

하둡을 이용한 개인화 영화 추천 시스템 (A Personalized Movie Recommender Systems using Hadoop)

  • 김세준;박두순;홍민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1135-1136
    • /
    • 2013
  • 인터넷의 발달함에 따라 데이터가 기존에 비해 기하급수적으로 늘어나게 되는 이른바 빅데이터 시대를 맞이하게 되었다. 이러한 빅데이터는 기존의 시스템으로 처리하기가 쉽지 않아 이를 처리하기 위해 하둡이 개발되었다. 하둡은 분산파일 시스템으로 기존의 시스템에 비해 빅데이터를 처리하는데 적합하며 이를 이용한 다양한 오픈 소스들이 등장하게 된다. 그중 기계학습 알고리즘을 구현한 오픈소스 Mahout은 추천 시스템을 구현하는데 적합하다. 이를 이용하여 기존에 구현한 개인화 영화 추천 시스템을 하둡 시스템으로 구현하고 기존의 XLMiner로 구현한 시스템과 결과를 비교해 본다.

클라우드 컴퓨팅 환경에서 협업필터링과 개인 성향을 이용한 개인화 소설 추천 시스템 (A Personalized Novel Recommendation System based on Collaborative Filtering and Personal Propensity in Cloud Computing Environment)

  • 장태훈;김한이;박두순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.406-407
    • /
    • 2016
  • 최근 바쁜 일상 속에서 개인의 삶의 질과 활력을 높이기 위해 여가활동에 대한 관심이 증가하고 있고 그 중에서 독서는 꾸준한 사랑을 받고 있는 여가 활동이다. 그 중 소설의 출판량은 다른 타 장르에 비해 가히 압도적이다. 하지만 소설은 개인의 취향에 영향을 많이 받는다는 특징이 있어 사용자에게 적합한 소설을 추천하기란 기존의 시스템으로는 한계가 있다. 따라서 본 논문에서는 클라우드 컴퓨팅 시스템인 AWS(Amazon Web Service)를 이용하며 사용자의 개인 성향과 협업 필터링 방법을 이용하여 각각의 개인 성향에 적합한 소설을 추천하는 시스템을 제안한다.

HRM 시스템의 개인정보보호기술 적용방안 (Applied Method of Personal Information Protection Technology in HRM System)

  • 강민영;박석천;홍석우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.691-694
    • /
    • 2013
  • 올해 정보보호 10대 이슈로 'SW 개발보안 의무화 및 정보관리범위 확대' 등이 제시되었으며, 이는 개인정보 보호에 대한 중요성이 더욱 부각될 것임을 보여주고 있다. 특히, 인적자원관리 시스템의 경우는 대부분 조직체 내 구성원들의 개인정보를 관리하고 있기 때문에 다른 시스템에 비해 보다 강화된 개인정보보호기술이 적용되어야 한다. 본 연구에서는 IT시장 동향 및 통계자료를 통해 개인정보보호기술의 중요성을 확인하고 국내외 관련 개발기술동향과 사례분석을 통해 HRM(인적자원관리) 시스템 내 개인정보보호기술 적용방안을 제안한다.

의미있는 정보 검색을 위한 개인화된 다중 전략 학습 모듈의 설계 및 구현 (Design and Implementation of PMSL for Information Retrieval)

  • 유수경;김교정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.208-210
    • /
    • 2004
  • 오늘날 인터넷상에서 존재하는 않은 정보들은 다양한 사용자의 개인 특성에 안게 새로운 정보의 지식으로 제공되어지기를 원한다. 기존의 연구는 단일 학술 기법을 통해 정보를 추출했으나 사용자에게 보다 의미 있는 정보를 제공하기 위해 다중 전략 학습 기법인 PMSL(Personalized Multi-Strategy Learning) 모듈 시스템을 제안하고자 한다. PMSL 모듈은 인터넷의 정보를 여과하여 필터링하고, 사용자 개인화의 키워드를 중심으로 연관된 객체를 추출한다. 이때 연관된 객체 추출시 대용량 데이터에서 시간적, 공간적면에서 효율적인 연관 탐색 기법인 Fp-Tree와 Fp-Growth 알고리즘을 적용시킴으로 결과의 효율성을 높이고자 하였으며, 연관규칙의 문제점을 보완하기 위해 가중치 기법인 TF*IDF 학습 기법을 적용시켰다. PMSL 모듈을 실행한 결과 기존 학습 기법에 비해 보다 더 의미 있는 연관 지식을 추출하게 되었다.

  • PDF

문장종속형 화자확인에서의 관측확률 가중기법 (Observation Probability Weighting Method for Text-Dependent Speaker Verification)

  • 김세현;장길진;오영환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.28-31
    • /
    • 1999
  • 기존의 문장종속형 화자인식 방법들은 대부분 음성인식에서 사용되는 방법을 그대로 적용하기 때문에, 화자의 개인성 정보보다 음운정보에 더 민감한 단점이 있다. 화자인식 시스템의 성능향상을 위해서는 음운정보보다는 화자의 개인성 정보가 잘 반영되도록 하는 것이 중요하다. 본 논문에서는 HMM(hidden Maxkov model)을 기반으로 한 문장종속형 화자확인 시스템의 성능향상을 위한 관측확률 가중 반법을 제안한다. 먼저 주어진 학습자료에서 화자의 개인성이 잘 반영된 프레임들을 예측한다. 임의의 입력음성에 대한 인식점수는 화자의 특징이 잘 반영된 프레임의 관측확률에 가중치를 주어 구한다. 제안한 방법을 적용한 결과 기존의 우도비(likelihood ratio) 정규화 점수를 사용하는 방법에 비해 동일오류율(EER, equal error rate)을 $2\~3\%$정도 줄여 인식율 향상을 얻을 수 있었다.

  • PDF

빅데이터와 개인정보: 규제변화의 필요성 (Big Data and Personal Information: Needs for Regulatory Change)

  • 이호선
    • 한국정보통신학회논문지
    • /
    • 제23권12호
    • /
    • pp.1565-1570
    • /
    • 2019
  • 빅데이터를 활용한 다양한 가능성에 대해서는 최근 수년 동안 지속적으로 이야기되어 왔다. 한편으로 개인정보보호의 중요성 또한 점차 강조되고 있는 것이 현실이다. 빅데이터의 활용성을 높이기 위해 개인과 관련된 다양한 정보들을 취합하는 과정에서 개인을 어느 정도까지 특정할 것인가 또는 빅데이터를 구축하고 활용하는 여러 기업들이 개인정보를 어느 수준까지 활용하여 개인화 서비스를 제공해야 하는가와 같은 문제들이 발생하고 있다. 본 논문에서는 개인정보의 보호와 관련하여 유럽의 GDPR과 미국 캘리포니아주의 CCPA 사례를 살펴보고 국내의 빅데이터3법 개정안에 대해 살펴보았다. 또한 개인정보의 빅데이터 활용에 있어 비식별화된 정보의 재식별 가능성에 대한 고려, 개인정보 사용 동의의 사회적 비용 측면, 민간과 정부의 빅데이터 구축과 결합에서 발생가능한 문제, 규제환경 형성에서의 정책적 시사점에 대해 논의하였다.