• 제목/요약/키워드: 보상 확률

검색결과 114건 처리시간 0.021초

Combining Multiple Strategies for Sleeping Bandits with Stochastic Rewards and Availability (확률적 보상과 유효성을 갖는 Sleeping Bandits의 다수의 전략을 융합하는 기법)

  • Choi, Sanghee;Chang, Hyeong Soo
    • Journal of KIISE
    • /
    • 제44권1호
    • /
    • pp.63-70
    • /
    • 2017
  • This paper considers the problem of combining multiple strategies for solving sleeping bandit problems with stochastic rewards and stochastic availability. It also proposes an algorithm, called sleepComb(${\Phi}$), the idea of which is to select an appropriate strategy for each time step based on ${\epsilon}_t$-probabilistic switching. ${\epsilon}_t$-probabilistic switching is used in a well-known parameter-based heuristic ${\epsilon}_t$-greedy strategy. The algorithm also converges to the "best" strategy properly defined on the sleeping bandit problem. In the experimental results, it is shown that sleepComb(${\Phi}$) has convergence, and it converges to the "best" strategy rapidly compared to other combining algorithms. Also, we can see that it chooses the "best" strategy more frequently.

A data extension technique to handle incomplete data (불완전한 데이터를 처리하기 위한 데이터 확장기법)

  • Lee, Jong Chan
    • Journal of the Korea Convergence Society
    • /
    • 제12권2호
    • /
    • pp.7-13
    • /
    • 2021
  • This paper introduces an algorithm that compensates for missing values after converting them into a format that can represent the probability for incomplete data including missing values in training data. In the previous method using this data conversion, incomplete data was processed by allocating missing values with an equal probability that missing variables can have. This method applied to many problems and obtained good results, but it was pointed out that there is a loss of information in that all information remaining in the missing variable is ignored and a new value is assigned. On the other hand, in the new proposed method, only complete information not including missing values is input into the well-known classification algorithm (C4.5), and the decision tree is constructed during learning. Then, the probability of the missing value is obtained from this decision tree and assigned as an estimated value of the missing variable. That is, some lost information is recovered using a lot of information that has not been lost from incomplete learning data.

SNS Advertisement Brokerage Platform Based On Viral Widget (측정위젯 기반 SNS 광고 중개)

  • Park, Kiung;Kwon, Hee-Gu;Yu, Dong-Kyun;Lee, Jae-Won
    • Proceedings of the Korea Contents Association Conference
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.449-450
    • /
    • 2014
  • 온라인 마케팅 요소 중 하나로 개인의 SNS를 통해 이루어지는 바이럴마케팅(Viral Marketing)이 각광 받고 있다. 이러한 흐름 속에서 콘텐츠의 바이럴을 유도하기 위한 수단으로 보상형광 고가 많이 활용되고 있다. 하지만 종래의 보상형광고 추첨을 통해 특정인에게만 지급이 되고 그 당첨확률은 매우 낮았다. 초기에는 매우 번창하였으나 당첨가능성이 없다는 인식이 확대되면서 참여율은 지속적으로 하락하였고, 보상형광고를 통한 바이럴마케팅 유도 사례는 점점 보기 어려워졌다. 이러한 문제점을 해소하기 위해 측정위젯을 기반으로 하여 콘텐츠의 바이럴의 생성과 확산에 기여도가 높은 참여자일수록 성과제로 더 많은 리워딩을 받을 수 있는 솔루션과 함께 광고주와 참여자를 직접 이어 줄 수 있는 플랫폼을 설계하였다.

  • PDF

Symbol Synchronization Compensation scheme for Eureka-147 (Eureka-147 시스템의 심볼 동기 보상 방법)

  • Park, So-Ra;Kim, Geon;Lee, Bong-Ho;Lee, Soo-In
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 한국방송공학회 2002년도 정기총회 및 학술대회
    • /
    • pp.193-196
    • /
    • 2002
  • 본 논문은 현재 국내 디지털 오디오 방송의 잠정 표준으로 채택된 Eureka-147 수신 시스템의 심볼 동기보상 방법에 관한 내용이다. 제안하는 방법을 이용하면 대략적 심볼 동기와 미세 심볼 동기를 모두 수행하는 일반적인 OFDM 심볼 동기 방법 대신 대략적 동기와 새로운 전처리 과정을 포함하는 보상 방법을 사용하여 수신 성능을 보장할 수 있다. 기본 아이디어는 시스템의 수신 성능에 큰 영향을 미치는 (+) 방향의 OFDM 심볼 동기 추정 오류의 발생 확률을 줄이는 것이다.

  • PDF

State Space Tiling and Probabilistic Action Selection for Multi-Agent Reinforcement Learning (다중 에이전트 강화 학습을 위한 상태 공간 타일링과 확률적 행동 선택)

  • Duk Kwon-Ki;Cheol Kim-In
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.106-108
    • /
    • 2006
  • 강화 학습은 누적 보상 값을 최대화할 수 있는 행동 선택 전략을 학습하는 온라인 학습의 한 형태이다. 효과적인 강화학습을 위해 학습 에이전트가 매 순간 고민해야 하는 문제가 탐험(exploitation)과 탐색(exploration)의 문제이다. 경험과 학습이 충분치 않은 상태의 에이전트는 어느 정도의 보상 값을 보장하는 과거에 경험한 행동을 선택하느냐 아니면 보상 값을 예측할 수 없는 새로운 행동을 시도해봄으로써 학습의 폭을 넓힐 것이냐를 고민하게 된다. 특히 단일 에이전트에 비해 상태공간과 행동공간이 더욱 커지는 다중 에이전트 시스템의 경우, 효과적인 강화학습을 위해서는 상태 공간 축소방법과 더불어 탐색의 기회가 많은 행동 선택 전략이 마련되어야 한다. 본 논문에서는 로봇축구 Keepaway를 위한 효율적인 다중 에이전트 강화학습 방법을 설명한다. 이 방법의 특징은 상태 공간 축소를 위해 함수근사방법의 하나인 타일 코딩을 적용하였고, 다양한 행동 선택을 위해 룰렛 휠 선택 전략을 적용한 것이다. 본 논문에서는 이 방법의 효과를 입증하기 위한 실험결과를 소개한다.

  • PDF

Perceived Intrinsic and Extrinsic Rewards on Nurses' Job Enthusiasm (인지된 내적 외적 보상이 간호사의 직무 열정에 미치는 영향)

  • Kim, Jae-Hee
    • Journal of the Korean Applied Science and Technology
    • /
    • 제38권6호
    • /
    • pp.1423-1432
    • /
    • 2021
  • This study aimed to understand the relationship between nurses' rewards and job enthusiasm, using the data from the 5th Korean Working Conditions Survey(2017). The subjects of this study consist of 359 nurses randomly sampled nationwide(218 from youth group, 141 from midddle age group). The effects of intrinsic and extrinsic rewards on job enthusiasm was indentified through GLM analysis. The results reveal that, for the entire group, participation in decision making, sense of achievement, self esteem, career prospects, recognition at work, work-life balance influence job enthusiasm. For the youth group, participation in decision making, sense of achievement, self esteem, career prospects, and work-life balance are the influencing factors; while for the middle age group, sense of achievement, self-esteem, and recognition at work are the influencing factors. In conclusion, we suggest establishing a reward system that incorporates participation in decision making, sense of achievement, self esteem, career prospects, recognition at work, and work-life balance, in order to boost nurses' job enthusiasm. Also, taking age groups into account when establishing such system may improve efficiency.

발 송 배전기술사 실력배양 문제

  • Lee, Gwi-Il
    • JOURNAL OF ELECTRICAL WORLD
    • /
    • 통권349호
    • /
    • pp.68-70
    • /
    • 2006
  • 배전계통에서선로의전압강하보상및 역율개선에의한설비용량증가문제는쉬운듯 하지만실제문제풀이에서는정답을내는확률이의외로낮다. 문제출제의도에따라서문제는다른듯 하지만접근하는기본원리식은같다. 즉, 설비가가지고있는설비용량[ k v a ]는 변함이없는데단지역율이변동됨에따라서유효전력[ k w ]이 설비용량을반경으로하는범위로변동된다는것이다.

  • PDF

발·송· 배전기술사 실력배양 문제

  • Lee, Gwi-Il
    • JOURNAL OF ELECTRICAL WORLD
    • /
    • 통권350호
    • /
    • pp.82-85
    • /
    • 2006
  • 배전계통에서 선로의 전압강하보상 및 역율개선에 의한 설비용량 증가 문제는 쉬운 듯 하지만 실제 문제풀이에서는 정답을 내는 확률이 의외로 낮다. 문제 출제의도에 따라서 문제는 다른 듯 하지만 접근하는 기본 원리식은 같다. 즉, 설비가 가지고 있는 설비용량[kva]는 변함이 없는데 단지 역율이 변동됨에 따라서 유효전력[kw]이 설비용량을 반경으로 하는 범위로 변동 된다는 것이다.

  • PDF

Adaptive Equalization using PDP Matching Algorithms for Underwater Communication Channels with Impulsive Noise (충격성 잡음이 있는 수중 통신 채널의 적응 등화를 위한 확률밀도함수 정합 알고리듬)

  • Kim, Nam-Yong
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • 제36권10B호
    • /
    • pp.1210-1215
    • /
    • 2011
  • In this paper, a supervised adaptive equalization algorithm based on probability density function (PDF) matching method is introduced and its decision-feedback version is proposed for underwater communication channels with strong impulsive noise and severe multipath characteristics. The conventional least mean square (LMS) algorithm based on mean squared error (MSE) criterion has shown to be incapable of coping with impulsive noise and multipath effects commonly shown in underwater communications. The linear PDF matching algorithm, which shows immunity to impulsive noise, however, has revealed to yield unsatisfying performance under severe multipath environments with impulsive noise. On the other hand, the proposed nonlinear PDF matching algorithm with decision feedback proves in the simulation to possess superior robustness against impulsive noise and multipath characteristics of underwater communication channels.

Feature Compensation with Model-based Estimation for Noise Masking (잡음마스킹을 이용한 환경보상기법)

  • Kim, Young-Joon;Kim, Nam-Soo;Lee, Yun-Gun
    • Proceedings of the KSPS conference
    • /
    • 대한음성학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.7-10
    • /
    • 2006
  • 본 논문에서는 음성의 모델을 이용하여 확률적인 기반으로 잡음의 마스킹 정도를 측정하는 방법에 대해서 제시한다. 잡음의 마스킹 정도를 측정하는 기준으로서 '잡음 마스킹 확률'을 구하는 방법에 대해서 설명하고 이의 특성에 대해서 알아본다. 그리고 잡음에 대한 '잡음 마스킹 확률'을 이용하여 잡음 환경에서의 음성인식 특징벡터의 성능 향상에 대해 적용해 보았다. 제안된 방법은 ETSI 에서 음성인식 표준실험으로 제시한 Aurora2 데이터베이스 상에서 실험해 보았다. 그 결과 기존의 알고리즘에 비해 16.58%의 성능 향상을 이루어 낼 수 있었다.

  • PDF