• 제목/요약/키워드: 암시적 방법

검색결과 183건 처리시간 0.027초

웹 문서의 정보블럭 식별을 통한 효과적인 사용자 프로파일 생성방법 (An Effective User-Profile Generation Method based on Identification of Informative Blocks in Web Document)

  • 류상현;이승화;정민철;이은석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.253-257
    • /
    • 2007
  • 최근 웹 상에 정보가 폭발적으로 증가함에 따라, 사용자의 취향에 맞는 정보를 선별하여 제공하는 추천 시스템에 대한 연구가 활발히 진행되고 있다. 추천시스템은 사용자의 관심정보를 기술한 사용자 프로파일을 기반으로 동작하기 때문에 정확한 사용자 프로파일의 생성은 매우 중요하다. 사용자의 암시적인 행동정보를 기반으로 취향을 분석하는 대표적인 연구로 사용자가 이용한 웹 문서를 분석하는 방법이 있다. 이는 사용자가 이용하는 웹 문서에 빈번하게 등장하는 단어를 기반으로 사용자의 프로파일을 생성하는 것이다. 그러나 최근 웹 문서는 사용자 취향과 관련 없는 많은 구성요소들(로고, 저작권정보 등)을 포함하고 있다. 따라서 이러한 내용들을 모두 포함하여 웹 문서를 분석한다면 생성되는 프로파일의 정확도는 낮아질 것이다. 따라서 본 논문에서는 사용자 기기에서 사용자의 웹 문서 이용내역을 분석하고, 동일한 사이트로부터 얻어진 문서들에서 반복적으로 등장하는 블록을 제거한 후, 정보블럭을 식별하여 사용자의 관심단어를 추출하는 새로운 프로파일 생성방법을 제안한다. 이를 통해 보다 정확하고 빠른 프로파일 생성이 가능해진다. 본 논문에서는 제안방법의 평가를 위해, 최근 구매활동이 있었던 사용자들이 이용한 웹 문서 데이터를 수집하였으며, TF-IDF 방법과 제안방법을 이용하여 사용자 프로파일을 각각 추출하였다. 그리고 생성된 사용자 프로파일과 구매데이터와의 연관성을 비교하였으며, 보다 정확한 프로파일이 추출되는 결과와 프로파일 분석시간이 단축되는 결과를 통해 제안방법의 유효성을 입증하였다.)으로 높은 점수를 보였으며 내장첨가량에 따른 관능특성에서는 온쌀죽은 내장 $2{\sim}5%$ 첨가, 반쌀죽은 내장 $3{\sim}5%$ 첨가구에서 유의적(p<0.05)으로 높은 점수를 보였으나 쌀가루죽은 내장 $1{\sim}2%$ 첨가구에서 유의적(p<0.05)으로 낮은 점수를 보였다. 이상의 연구 결과를 통해 온쌀은 2%, 반쌀은 3%, 쌀가루는 4%의 내장을 첨가하여 제조한 전복죽이 이화학적, 물성적 및 관능적으로 우수한 것으로 나타났다.n)방법의 결과와 비교하였다.다. 유비스크립트에서는 모바일 코드의 개념을 통해서 앞서 언급한 유비쿼터스 컴퓨팅 환경에서의 문제점을 해결하고자 하였다. 모바일 코드에서는 프로그램 코드가 네트워크를 통해서 컴퓨터를 이동하면서 수행되는 개념인데, 이는 물리적으로 떨어져있으면서 네트워크로 연결되어 있는 다양한 컴퓨팅 장치가 서로 연동하기 위한 모델에 가장 적합하다. 이는 기본적으로 배포(deploy)라는 단계가 필요 없게 되고, 새로운 버전의 프로그램이 작성될지라도 런타임에 코드가 직접 이동하게 되므로 버전 관리의 문제도 해결된다. 게다가 원격 함수를 매번 호출하지 않고 한번 이동된 코드가 원격지에서 모두 수행을 하게 되므로 성능향상에도 도움이 된다. 장소 객체(Place Object)와 원격 스코프(Remote Scope)는 앞서 설명한 특징을 직접적으로 지원하는 언어 요소이다. 장소 객체는 모바일 코드가 이동해서 수행될 계산 환경(computational environment

  • PDF

두레 : 분산시스템을 위한 병행연산모델 (DOORAE : A Concurrent Computation Model for Distributed Systems)

  • 김대권;박충식;이임건;이용석;박규태
    • 전자공학회논문지B
    • /
    • 제31B권11호
    • /
    • pp.1-10
    • /
    • 1994
  • 문제의 병행처리를 위한 모델링 방법과 문제의 병행성을 동적 환경에서 자동으로 검출하기 위하여 병행 연산모델 두레를 설계하고 두레언어 DL로 구현하였다. 두레모델은 문제의 모델링과 연산수행을 위해 단순하고 일관된 개념의 객체 정의와 메시지 전송개념을 지원한다. 문제의 병행처리를 프로그램에 명시하지 않고도 암시적으로 지원할 수 있도록 병행성의 검출 기준을 제안하였으며, 동적 환경에서 병행객체를 생성하여 최대한의 병행성을 보장하도록 하였다. 또한 객체의 연산 진행을 효율적으로 보장해 줄 수 있도록 Waiting Variable의 개념을 제안하였다.

  • PDF

앙상블 SVM을 이용한 동적 웹 정보 예측 시스템 (Dynamic Web Information Predictive System Using Ensemble Support Vector Machine)

  • 박창희;윤경배
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.465-470
    • /
    • 2004
  • 기존의 웹 정보 예측 시스템은 예측에 필요한 정보를 얻기 위하여 사용자 프로파일과 사용자로부터의 명시적 피드백 정보를 필요로 하는 단점이 존재한다. 본 논문에서는 이러한 단점을 극복하고자 웹 사이트에 접속한 고객의 행동을 나타내는 클릭 스트림 데이터와 이를 기반으로 한 사용자의 암시적 피드백 정보를 이용하여 각 사용자가 가장 필요로 하는 웹 정보를 예측한다. 이를 이용하여 관련 정보를 제공할 수 있는 앙상블 SVM을 이용한 동적 웹 정보 예측 시스템을 설계하고 구현하며, 기존의 웹 정보 예측 시스템과 성능 비교를 수행한 결과, 제안된 방법의 우수함이 입증되었다.

공간데이타 마이닝을 위한 효율적인 그리드 셀 기반 공간 클러스터링 알고리즘 (An Efficient Grid Cell Based Spatial Clustering Algorithm for Spatial Data Mining)

  • 문상호;이동규;서영덕
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.567-576
    • /
    • 2003
  • 대용량의 공간데이터베이스로부터 암시적이고 유용한 지식을 자동적으로 추출하는 공간데이터 마이닝은 데이타 양이 급격히 증가하면서 필요성이 더욱 증대되고 있다. 공간데이터 마이닝에서 데이타를 분석하여 유사한 그룹으로 분류하는 공간 클러스터링은 매우 중요한 분야이다. 기존 연구에서 공간 클러스터링을 위한 여러 가지 알고리즘들이 제시되었지만, 다음과 같은 문제점들이 있다. 먼저 클러스터링을 위하여 객체들 간의 거리론 기반으로 하므로 데이타 양이 많아질수록 계산 비용이 커진다. 또한, 메모리 상주 데이타를 대상으로 하므로 대용량의 데이타인 경우에 효율이 떨어진다. 본 논문에서는 공간데이터 마이닝을 위하여 그리드 셀을 기반으로 한 효율적인 공간 클러스터링 방법을 제시한다. 이 클러스터링에서는 기존 공간 클러스터링 기법들의 문제점을 해결하는데 중점을 둔다. 세부적으로 공간 클러스터링의 효율성을 높이기 위하여 클러스터링시에 발생하는 비용(계산량)을 감소시키는 것이다. 이를 위해서 공간지역성을 보장하는 대표적인 공간분할 방법인 그리드 셀을 기반으로 한 공간 클러스터링 기법을 제시한다.

초등학교 5학년 영어 교과서 분석: 어휘학습전략 중심으로 (Investigating Vocabulary Learning Strategies Instruction in Korean Elementary School English Textbooks)

  • 김금선;임희주
    • 한국콘텐츠학회논문지
    • /
    • 제14권4호
    • /
    • pp.435-444
    • /
    • 2014
  • 최근 외국어 학습에 있어 어휘 학습의 중요성이 부각되며 어휘학습전략 교육에 대한 관심이 급증하였다. 하지만 어휘학습전략 연구는 아직 미비한 상태로, 특히 어휘 학습이 필수적인 어린이 영어 학습자 대상의 연구가 필요하겠다. 따라서 본 연구는 초등학교 영어 교과서에 수록되어 있는 어휘학습 활동과 전략을 분석하여, 전반적인 사용 실태를 알아보고 어린이 영어어휘 지도에 주는 시사점을 논의하고자 한다. 이를 위해 초등학교 5학년 영어 교과서 중 총 3개의 교과서와 교사지도서를 선택하고, 수록된 어휘관련 학습활동들을 Schmitt(1997)의 어휘학습전략 분류표로 분석하였다. 연구 결과, 분석에 사용된 교과서 3종 모두 다양한 어휘학습전략의 종류를 포함하지 않았다. 3종의 교과서에서 사용된 전략은 상위전략인 발견전략과 강화전략 중 Y사 교과서에서 발견된 '영한사전을 이용한다'를 제외하고는 모두 강화전략이었으며, 암시적인 학습방법이 사용되었다. 우리나라 학습자들이 제한된 어휘학습전략을 선호하고 사용한다는 국내 선행연구 [2][4][23]의 결과를 고려해볼 때, 영어교육현장에서는 앞으로 보다 다양한 어휘학습전략을 여러 가지 방법으로 소개하고 활용해볼 수 있는 기회를 제공할 필요성이 있겠다.

웹 그래픽의 비주얼펀(Visual Pun)적용 연구 (A study on the visual pun for web graphics)

  • 조규창;오병근
    • 디자인학연구
    • /
    • 제16권4호
    • /
    • pp.433-442
    • /
    • 2003
  • 펀(Pun)은 언어사용에 있어서 수사학적 효과를 얻기 위해 사용되던 개념인데 비주얼 커뮤니케이션을 위한 디자인에서도 그 개념이 적용될 수 있다. 언어표현에서의 단어가 상징적 이미지로 대치되어 비주얼 펀(Visual Pun)의 형식으로 커뮤니케이션 디자인을 위한 방법이 될 수 있는 것이다. 비주얼 펀의 표현은 고대의 그림문자에서부터 현대의 회화 디자인 등의 시각 언어를 다루는 모든 분야에서 적용되었다. 시각 커뮤니케이션을 위한 비주얼 펀의 표현 방법은 크게 세 가지로 구분할 수 있다 먼저 상징적 이미지를 통해 두 가지 이상의 의미발생을 하고 그 전체적 의미전달은 직접적으로 표현되는 직설적 펀과, 하나의 상징적 이미지나, 또는 두 개의 상징적 이미지의 결합을 통해 다양한 의미의 발생이 이루어지면서 전체적인 의미를 암시적으로 표현하고 강화하는 것의 연상적 펀이 있다. 그리고 유사한 두 가지의 상징적 이미지를 서로 비교하거나, 유사한 이미지들의 병치를 통해 전체적 의미를 강화하는 비교적 펀으로 정의될 수 있다. 전통적 시각 커뮤니케이션을 위한 문법으로 활용되었던 비주얼 펀의 개념은 다양하고 새롭게 나타나는 매체에서의 시각표현에서도 여전히 유효한 방법이 될 수 있다. 따라서 웹사이트에 나타나는 상징적 이미지의 사용에도 비주얼 펀의 개념이 적용되는 것은 자연스럽다. 웹사이트에서 이미지의 구성형식은 전체 사이트의 차별성을 드러내는 가장 중요한 요소 중의 하나이다. 그러나 현재의 웹사이트는 사용성과 같은 기능 위주의 디자인에 중점을 두다보니 그 형식이 점차 획일화되고 있으며, 이는 일정한 틀이 형성되어 디자이너들이 무의식적으로 따라가는 경향을 보이고 있다. 이런 상황에서 웹 디자인을 위해 비주얼 펀의 개념 적용에 대한 새로운 인식은 웹사이트에서의 상징성을 강화하여 정보전달의 의미를 강화할 수 있는 디자인방법이 될 수 있다. 그로 인해 다른 사이트와 구별되는 차별적 아이덴티티를 확보할 수 있고 보다 효율적인 커뮤니케이션이 이루어지게 하는 디자인 문제 해결을 위한 대안이 될 수 있는 것이다.

  • PDF

선군집분할방법에 의한 특징 추출 (Feature Extraction by Line-clustering Segmentation Method)

  • 황재호
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.401-408
    • /
    • 2006
  • 영상신호의 수직축 및 수평축 화소 성분 분석을 통해서, 영상 내부에 존재하는 각 영역의 군집적 특성을 통계 및 영역적으로 처리 분류함으로써 필요한 특징을 추출할 수 있는 새로운 형태의 영역분할처리 알고리즘을 제시한다. 종래의 점처리나 면처리 방식에 비해 이 방식은 수평축과 수직축 상에서의 연속적인 선처리 방식이라고 할 수 있다. 영상을 구성하는 영역간 경계가 암시적으로 구분되어 있으나, 명시적으로는 불투명하고, 영상 특성의 분기점 또한 불명확하고 중복되어 있음으로 인하여 문턱치처리나 분기점처리로 그 영역간 특정을 분할, 추출하기가 곤란한 경우에 이 방식은 우수한 효과가 있다. 수평축 및 수직축 선처리를 통해 각 영역들의 특성들을 군집으로 처리한 다음 처리한 축과 수직 방향으로 축차적 적응진행처리한다. 그 결과 영상 내 각 영역은 화소값의 중복에도 불구하고 하나의 군집으로 자리매김하면서 군집 고유의 화소 값을 갖는다. 그리고 처리후 영상은 각 군집에 부여한 새로운 화소값으로 변환함으로 필요한 특정이 추출된다. 이 방식은 특히 영역 분할을 통해 시각적 효과를 극대화시킬 필요가 있는 경동맥 초음파 의료영상에서 우수한 결과를 보였다.

한국어 중의적 형태소 표상양식과 처리 특성 : 실어증 환자를 중심으로 (The Processing and Representations of Ambiguos Morpheme in Korean Words : Centered in Aphasics.)

  • 정재범;편성범;김태훈;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.151-156
    • /
    • 2002
  • 중의적인 단어를 처리하는 방법에 대한 선행연구로, 첫째 문맥에 맞는 의미가 먼저 활성화된다는 가설과 둘째, 여러 뜻 중에 상대적인 빈도에 따라 많이 쓰이는 의미가 먼저 활성화되고, 그것이 문맥과 일치하지 않는다면, 다른 관련된 의미를 찾는다는 가설이 제기되었다. 마지막으로 문맥에 상관없이 모든 의미가 활성화 된 후 문맥을 고려하여 문맥에 적절한 의미를 선택한다는 가설이 있다. 본 연구에서는 '먹을', '감을' 등과 같이 2가지 의미의 품사가 다른 중의 어절과 '쥐어', '감어' 등과 같이 어절 문맥('어')이 주어진 어절의 의미 활성화가 어떻게 다른지를 조사하였다. 본 연구의 목적을 위해 점화어휘 판단 과제를 사용하였다. 실험 1의 결과는 SOA 150ms 조건에서 점화자극어절과 관련된 의미가 품사와 관련 없이 모두 활성화되었다. SOA 1000ms 조건에서는 상대적으로 많이 쓰이는 체언의 의미는 계속 활성화 되어 있는 반면, 용언의 의미 점화량은 감소하였다. 명칭성 실어증 환자인 SDK의 경우 SOA 150ms 조건에서는 일반인과 같은 형태소 처리특성을 보였으나 1000ms 조건에서는 달랐다. 다른 명칭성 실어증 환자인 BIS과 전반성 실어증 환자인 PSB는 SOA 150ms 조건과 1000ms 조건에서 일반인과 아주 다른 양상을 보였다. 이것은 실어증 환자의 타잎에 따라 형태소의 처리나 중의적인 의미 활성화가 일반인과는 다르다는 것을 보여준다. 실험 2에서는 어절 문맥이 있는 '먹어', '쥐어', '감어' 등과 같은 어절을 사용하였다. 실험 2의 결과는 SOA 150ms 조건일 때 어절문맥의 영향으로 용언의 의미만 촉진적 점화효과가 있었고, 체언의 의미는 활성화되지 않았다. 그러나 SOA 1000ms로 지연시켰을 때는 용언뿐만 아니라 체언의 의미도 촉진적 점화효과가 있었다. 실험 1과 2의 결과는 중의적인 한국어 어절의 경우에도 모든 의미가 활성화되나 어절 문맥이 존재할 때는 어절 문맥의 제약으로 어절 문맥에 맞는 한 가지 의미만 활성화된다는 것을 암시한다. 또한 이러한 결과는 한국어 어절이 분석된 형태가 아닌 어절 형태로 심성 어휘집에 저장되어 있다는 것을 암시한다. 실어증 환자의 경우 실험 1과 마찬가지로 환자의 수준이나 종류에 따라 다양한 반응을 보여주었다.

  • PDF

암시적 피드백 데이터의 행렬 분해 기반 누락 데이터 모델링 (Missing Data Modeling based on Matrix Factorization of Implicit Feedback Dataset)

  • 기가기;정영지
    • 한국정보통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.495-507
    • /
    • 2019
  • 데이터 희소성은 추천 시스템의 주요 과제 중 하나이다. 추천 시스템에서는, 일부분만 관찰된 데이터이고 다른 부분은 데이터가 누락된 대용량 데이터를 포함하고 있다. 대부분의 연구에서는, 데이터 세트에서 무작위로 데이터가 누락되었다고 가정하고, 관찰된 데이터만을 사용하여 추천 모델을 학습함으로써 사용자에게 항목을 추천하고 있다. 그러나, 실제로는 누락된 데이터는 무작위로 손실되었다고 볼 수 없다. 본 연구에서는, 누락 된 데이터를 사용자적 관심의 부정적인 예라고 간주하였다. 또한, 3가지 샘플 접근 방식을 SVD++ 알고리즘과 결합하여 SVD++_W, SVD++_R 그리고 SVD++_KNN 알고리즘을 제안하였다. 실험결과를 통하여, 제안한 3가지 샘플 접근 방식이 기존의 기본적인 알고리즘 보다 Top-N 추천에서 정확성과 회수율을 효과적으로 향상시킬 수 있다는 것을 보였다. 특히, SVD++_KNN 가 가장 우수한 성능을 보였는데, 이는 KNN 샘플 접근 방식이 사용자적 관심의 부정적인 예를 추출하는데 가장 효율적인 방법이라는 것을 보여주었다.

Multicriteria Movie Recommendation Model Combining Aspect-based Sentiment Classification Using BERT

  • Lee, Yurin;Ahn, Hyunchul
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.201-207
    • /
    • 2022
  • 본 논문에서는 영화 추천 시 평점뿐 아니라 사용자 리뷰도 함께 사용하는 영화 추천 모형을 제안한다. 제안 모형은 고객의 선호도를 다기준 관점에서 이해하기 위해, 사용자 리뷰에 속성기반 감성분석을 적용하도록 설계되었다. 이를 위해, 제안 모형은 고객이 남긴 리뷰를 다기준 속성별로 나누어 암시적 속성을 파악하고, BERT를 통해 이를 감성 분석함으로써 각 사용자가 중요시 생각하는 속성을 선별적으로 협업필터링에 결합하여 추천 결과를 생성한다. 본 연구에서는 유용성을 검증하기 위해 제안모형을 실제 영화 추천 사례에 적용해 보았다. 실험결과 전통적인 협업필터링 보다 제안 모형의 추천 정확도가 향상되는 것을 확인할 수 있었다. 본 연구는 개인의 특성을 고려하여 모형을 선별하여 사용하는 새로운 접근법을 제시하였고, 속성 각각에 대한 평가 없이 리뷰로부터 여러 속성을 파악할 수 있는 방법을 제시했다는 측면에서 학술적, 실무적 의의가 있다.