1. 서론
디지털 혁명이 일어나고 있는 4차 산업혁명 시대에 다양한 콘텐츠들을 디지털 환경에서 제공하기 위한 다양한 시도가 이뤄지고 있다. 데이터를 사용자가 원하는 형태로 제공하기 위해 데이터를 필터링하는 간단한 기법부터[1,2], 인공지능, 딥 러닝을 이용하여 사용자와 콘텐츠를 분석하여 제공하는 등 다양한 기법이 존재한다.[3,4] 이렇게 사용자가 원하는 정보를 적절히 분석하여 제공하는 시스템을 추천 시스템이 라고 하며, 다양한 필터링 기법 및 머신러닝 기법을 기반으로 개발되고 있다.
현재 채용 시장에서는 다양한 헤드헌팅 서비스가 온라인에서 제공되고 있으나 대부분 전통적인 필터링 방식의 검색서비스나 전문 헤드헌터들이 직접 구직자의 정보를 일일이 분석하는 형태로 제공되고 있다. 이러한 서비스 형태에서는 이력정보가 불특정 다수에게 공개되는 문제, 채용인력에 대한 신뢰성이 떨어진다는 문제, 정보 검색의 어려움, 헤드헌터에게서 발생하는 인건비로 인한 고액의 수수료 등 다양한 문제점들이 발생하고 있다.[5,6]
본 논문에서는 선행연구[7]에서 설계 및 구현한 지능형 헤드헌팅 서비스를 위한 중개 채용 서비스 시스템을 개선하기 위해 딥 러닝 기술 기반의 협업 딥러닝 알고리즘을 적용하여 구직자와 헤드헌터들에게 더욱 신뢰성 있고 정확한 정보를 제공하기 위한 딥 러닝 기반의 중개 채용 서비스 시스템을 제안한다. 제안하는 지능형 온라인 헤드헌팅 서비스를 위한 협업 딥 러닝 기반의 중개 채용 서비스 시스템은 기업체에서 지원자(구직자) 채용을 효율적으로 채용 및 관리하기 위한 지능형 서비스 시스템으로, 지원자(구직자)의 프로파일을 관리하여 추천할 수 있는 모듈과 인재검증을 사전에 예측하고, 인재유형을 분석할 수 있는 알고리즘을 협업 딥 러닝을 적용하여 구현하였다.
본 논문의 구성은 다음과 같다. 2장은 관련연구로서 기존의 필터링 기반의 추천 기법들과 문제점, 그리고 딥 러닝 기술을 적용한 추천 알고리즘에 대하여 서술하고, 이를 지능형 헤드헌팅 서비스에 적용한 사례들에 대해 서술한다. 3장은 제안하는 협업 딥 러닝 기반의 중개 채용 서비스 시스템에 대하여 기술한다. 4장에서는 제안한 서비스 시스템을 구현하고 이를 검증하기 위한 설문조사 분석 내용에 대해 기술하고, 마지막으로 5장에서 결론 및 향후 연구로 맺는다.
2. 관련연구
필터링 기반의 추천 시스템의 대부분은 유사도 계산을 통해 데이터를 필터링하고 정렬하여 사용자에게 최적의 콘텐츠를 추천하는 알고리즘으로 동작한다.[8] 대표적인 알고리즘으로는 협업 필터링, 내용 기반 필터링 등이 있다. 협업필터링은 사용자 기반과 콘텐츠 기반으로 나눠진다. 가지고 있는 이력이 유사한 사용자 또는 콘텐츠를 찾아서 가지고 있는 이력 중 공통되는 부분을 제외한 나머지를 서로에게 추천해주는 방식이다. 내용기반 필터링은 사용자가 사용한 이력이 있는 아이템과 유사한 아이템을 찾아 추천해주는 방법이다. 이러한 다양한 필터링 기법들은 추천 서비스의 형태에 따라 적절한 기법을 적용하여 사용하게 되며 혼합하여 사용하는 혼합 필터링 기법이 있다.[9]
필터링 기법을 단일로 사용할 경우 발생하는 문제점이 존재한다. 협업 필터링의 경우 초기 사용자나 아이템이 이력을 가지고 있지 않아 발생하는 Coldstart 문제가 있다.[10] 내용기반 필터링은 아이템의 속성만을 고려하여 추천하기 때문에 사용자의 선호나 상황을 고려하지 못해 추천 정확도가 낮은 문제가 있다. 규칙기반은 미리 정해진 규칙을 따르기 때문에 다양한 상황이나 현상에 대응이 어렵다는 문제가 있다.
최근에는 딥 러닝 기술을 적용하여 필터링 기반의 추천 시스템의 문제점을 개선하기 위한 연구가 활발히 진행되고 있다. 추천 시스템에 딥 러닝을 적용시킬 경우 추천의 정확도는 비약적으로 향상시킬 수 있으며, 사용자의 선호, 콘텐츠의 속성 등 다양한 정보를 분석하여 추천이 가능하다[11, 12, 13]. 이러한 딥러닝 기반의 추천 시스템은 사용자와 콘텐츠의 정보를 사전에 미리 분석하고, 일정 주기 동안 해당 데이터 기반의 추천이 가능한 환경에서는 적합하다고 볼 수 있다. 예를 들어, 신규 사용자와 콘텐츠의 유입이 제한적인 영화, 도서, 음악 등의 콘텐츠 추천에서 적합하다고 볼 수 있다. 딥 러닝은 모델의 복잡도가 높고 연산시간도 길기 때문에, 실시간으로 새로운 콘텐츠가 생겨나는 SNS나 공유경제 플랫폼 등과 같이 실시간으로 분석하고 사용자에게 제공하는 추천 서비스 환경에서는 적합하지 못하다는 단점이 있다.
3. 협업 딥 러닝 기반의 중개 채용 서비스 시스템
3.1 제안한 서비스 시스템 개요
본 절에서는 선행연구 [7]에서 제안한 지능형 온라인 헤드헌팅 서비스를 위한 중개 채용 서비스 시스템을 개선하기 위해 Fig. 1과 같이 협업 딥 러닝 알고리즘을 적용하여 더욱 정밀하고 정확한 인재추천이 가능하도록 설계하였다.
Fig. 1. The improved service system
우선 ①중개 채용 서비스 모듈(Agent Recruitment Service Module)은 웹 및 모바일 환경에서 기업체 채용 담당자 혹은 지원자(구직자)가 자신에게 적합한 헤드헌터를 선택할 수 있도록 처리하는 모듈로, 기업체 채용담당자(구인자)와 헤드헌터 간에 지수화된 기준들을 통해 신뢰를 기반으로 거래가 가능하며, 채용 후보자 선별을 자동으로 선정하도록 지원한다. ③레퍼런스 제어 및 관리 모듈(Reference Control/ Management Module)은 채용담당자가 지원자 정보를 입력하면 지원자 그룹의 디렉토리가 생성되어 ②사용자 데이터베이스(User DB)에 저장되고, 질문지를 라이브러리에서 불러와서 질문별 답변 유형도 설정할 수 있다. 인재검증을 위한 사전 예측 알고리즘을 통해 지원자(구직자)의 재능과 능력을 수치화하고 수치화된 정보를 바탕으로 협업 딥 러닝 알고리즘을 통해 채용담당자(구인자) 및 헤트헌터에게 최적의 정보를 추천할 수 있다. 마지막으로 ④정보 시각화 모듈(Information Visualization Module)은 사용자의 프로파일 정보를 기반으로 분석된 내용을 인포그래픽으로 시각화하여 사용자들에게 제공한다.
3.2 협업 딥 러닝 기반의 인재 추천 알고리즘
본 절에서는 인재 검증을 위해 지원자의 재능/능력을 직관적으로 평가하기 위해 수치화하고, 수치화된 데이터를 분석하여 최적의 인재를 헤드헌터에게 추천할 수 있는 협업 딥 러닝 기반의 인재 추천 알고리즘에 대해 서술한다. 알고리즘은 Fig. 2와 같이 크게 두 부분으로 동작한다.
Fig. 2. The improved Prediction Algorithm using Collaborative Deep Learning.
Algorithm 1. Collaborative Deep Learning based on RNN
첫 번째로, 인재검증을 위한 사전 예측 알고리즘으로, 지원자의 프로파일 데이터를 정규화한 후 정규화된 프로파일 데이터를 기반으로 뿌리 노드(Root Node)와 잎 노드(Leaf Node)를 포함하는 의사결정 트리와 인재검증에 필요한 사전 예측을 위한 규칙을 생성한다. 생성된 규칙을 기반으로 지원자의 재능 및 능력에 대해 수치화된 데이터를 추출한다. 제안된 사전 예측 알고리즘은 우선 정규화된 프로파일에서 데이터의 각 변수에 대한 엔트로피 계수를 계산한다. 정규화된 프로파일 데이터의 각 변수에 대한 정보 이득(information gain)은 특정 데이터 속성에 데이터를 구분할 수 있도록 하는 것으로 프로파일 데이터의 각 변수에 대한 엔트로피 계수에 파생되는 하위 노드의 엔트로피 가중치의 평균값(기대정보)의 차를 구하여 계산한다.
두 번째로, 추출된 수치화된 재능/능력 데이터를 기반으로 협업 딥 러닝 알고리즘을 수행한다. 협업딥 러닝은 추천 기술에 가장 대표적으로 사용되는 협업 필터링(Collaborative Filtering)과 사용자 유사도 분석을 위한 K-NN 알고리즘, 그리고 행렬 형태의 데이터셋 분석에 적합하고 뉴런의 순환 구조를 통해 에러를 최소화 할 수 있는 딥 러닝 알고리즘인 RNN(Recurrent Neural Network)를 혼합한 추천 알고리즘이며 Algorithm 1과 같이 동작한다.
Algorithm 1에서는 지원자(구직자)의 수치화된 재능 및 능력 데이터셋 U를 입력 데이터로 설정하고 예측된 n번째 사용자 U의 최적화된 채용 정보 \(\hat{h}_{n}\)과 추천 리스트 RNN -Rec-Listn가 출력 데이터가 된다. 우선 첫 번째로 활성함수인 시그모이드(sigmoid)에 대한 정의를 하고 RNN에 필요한 파라미터인 alpha, input_dim(input dimensions), hidden_dim(hidden dimensions), output_dim(output dimensions), train_ cir(train circle, 학습 분기 횟수)를 정의한다. 다음으로 가중치를 초기화하고 학습 모델인 chra_model을 생성할 준비를 한다. RNN에서는 모델 생성에서 에러를 제거하기 위해 기본적으로 전파(forward prop-agation)와 역전파(back propagation)을 수행한다. 예측된 최적화 채용 정보는 학습된 chra_model을 통해 생성되며, 이때 KNN 클러스터링을 통해 유사 사용자에 대한 분석 데이터를 바탕으로 계산되며 KNN 클러스터링은 수식 (1)과 같이 계산된다. 여기서 k는 군집의 개수이며 두 사용자 xi와 yi의 차를 구하여 거리를 기반으로 유사도를 계산하게 된다.
\(\sum_{i=1}^{k}\left|x_{i}-y_{i}\right|\) (1)
마지막으로 추천 리스트인 RNN -Rec-Listn가 예측된 최적화 채용 정보를 기반으로 생성되어 사용자에게 제공된다.
4. 구현
4.1 구현 결과
Fig. 3은 개선된 협업 딥 러닝 기반의 중개 채용서비스 시스템으로 구현 및 운영되고 있으며, 서비스 만족도 조사 및 분석은 서비스를 이용하고 있는 대상으로 서비스 만족도를 조사하였다. 선행연구[6]의 모집단 수 486명보다 약 3배(273.4%) 많은 1329명 모집단의 데이터 셋을 수집하여 서비스 만족도 분석을 수행하였으며, 데이터 셋은 Fig. 4와 같다.
Fig. 3. Implemented Service System.
Fig. 4. Part of Data Set of Job Seeker.
∙ 구현 환경
- 운영체제 : Window 10(64bit)
- 개발언어 : Java, Phthon(Tensorflow), HTML5, RESTful API
- 데이터베이스 : RDBMS(PostgreSQL)
∙ 데이터 셋 구성
- 모집단 1329명(총 1338명 중 중요정보가 누락되어 평가가 불가한 9명 제외)
- Table 2와 같이 서비스 시스템에 회원 가입된 학부(921명), 석사(297명), 박사(111명)의 채용 지원자(구직자)로 구성되며, 학력수준에 평가는 1차 레퍼리(1∼6차), 2차 레퍼리(1∼3차), 블라인드 레퍼리(1∼5차)로 평가하며, 그 평가점수와 평균을 계산
4.2 서비스 만족도 분석
본 절에서는 개선된 협업 딥 러닝 기반의 중개 채용 서비스 시스템을 이용 중인 사용자들의 서비스 만족도를 확인하기 위하여 주요 서비스 기능인 사용자 예측 분석을 통해 제공된 추천 콘텐츠의 만족도를 조사하였다. 만족도 설문은 총 모집단 1329명을 대상으로 만족도 피드백을 받았으며, 사용자 피드백은 총 990명으로 피드백 응답률은 74.49%이다. 사용자 피드백 수집은 구현된 웹 및 모바일 서비스를 통하여 온라인으로 수집하였으며, 사용자 예측 분석을 통해 제공된 추천 콘텐츠를 사용 또는 열람한 이후 일주일 이내에 구현된 시스템을 통한 질문에 대해 매우만족(A-5), 만족(A-4), 보통(A-3), 불만족(A-2), 매우 불만족(A-1) 다섯 가지 선택 방식을 선택하도록 하였다.
서비스 시스템의 전체적인 만족도는 Table 1과 같았으며, 전체 사용자 중 학부가 921명 중 759명(응답률 82.41%)이 응답하여 가장 많은 분포를 보였으며, 다음으로 석사가 297명 중 202명(응답률 68.91%), 박사가 111명 중 29명(응답률 26.13%)이 응답하였다. 서비스 만족도를 매우만족(A-5)과 만족(A-4)을 기준으로 만족한다고 분석하면 총 990명 중 759명(76.67%)가 만족한다고 분석되었다. 서비스 만족도의 분포를 보면 학부가 589명으로 77.6%, 석사는 148명으로 73.27%, 박사는 22명으로 75.86%로 분석되며, 학부 구직자의 만족도가 가장 높게 분석되었다. 그 중 석사 출신의 여자 사용자들의 만족도가 87.04%로 가장 높게 조사되었다.
Table 1. Age distribution of respondent and situation of lifestyle related disease
5. 결론
본 논문에서는 선행논문인 [7]에서 설계 및 구현한 지능형 중개 채용 서비스 시스템에서 분석되는 인재 검증 사전 예측 데이터와 인재유형 데이터를 기반으로 더욱 고도화된 추천이 가능하도록 기존의 추천 모듈에 협업 딥 러닝 알고리즘을 적용하였다. 협업 딥 러닝 기반의 중개 채용 서비스 시스템을 사용한 사용자들의 추천 결과에 대한 만족도는 선행논문에서 도출한 평균 만족도(64.5%) 보다 12.17% 높은 76.67%로 조사되었으며, 개선된 서비스 시스템이 더욱 정확하고 최적의 추천을 수행하였다. 향후 딥 러닝을 이용한 추천 알고리즘의 성능 개선을 위해서는 모델이 더 정확한 학습을 통해 생성될 수 있도록 더 많은 데이터가 축적될 필요가 있으며, 축적되는 데이터의 양에 따라 협업 딥 러닝 알고리즘의 파라미터 값에 대한 실험이 필요하다. 향후 사용자의 증가 및 서비스 이용에 따른 대량의 데이터 축적에 대해 주기 적인 모델의 추가 학습과 지능화된 추천 알고리즘의 추천 정확도 및 신뢰도에 대한 평가 연구가 필요하며, 딥 러닝 기술을 적용한 만큼 학습 데이터의 양이 방대해지고 모델이 분석 가능한 정보의 다양성이 높아지고 정확도가 향상되어 양질의 추천이 가능해질 것으로 기대된다.
References
- J.L. Herlocker, J.A. Konstan, A.I. Borchers, and J. Riedl, "An Algorithmic Framework for Performaing Collaborative Filtering," Proceedings of the 22nd Annual International ACM Special Internet Group on Information Retrieval Conference on Research and Development in Information Retrieval, pp. 230-237, 1999.
- V.M. Robin and M.V. Someren, "Using Content- based Filtering for Recommendation," Proceedings of the Machine Learning in the New Information Age: MLnet/ECML2000 Workshop, pp. 47-56, 2000.
- X. Wang and Y. Wang, "Improving Contentbased and Hybrid Music Recommendation Using Deep Learning," Proceedings of the 22nd ACM International Conference on Multimedia, pp. 627-636, 2014.
- W. Jian, J. He, K. Chen, Y. Zhou and Z. Tang, "Collaborative Filtering and Deep Learning based Recommendation System for Cold Start Items," Expert Systems with Applications 69, pp. 29-39, 2017. https://doi.org/10.1016/j.eswa.2016.09.040
- S.B. Won, "NCS Utilization in Recruitment and Selection : The Case of HRDKorea," Journal of Korean Management Consulting Review, Vol. 15, No. 4, pp. 217-228, 2015.
- S.C. Lee, "An Exploratory Study on Selection System Development and the Case of H Corporation," Journal of Korean Management Consulting Review, Vol. 17, No. 1, pp. 255-268, 2017.
- W.J. Lee and K.M. Cho, "Design and Implementation of Agent-Recruitment Service System for the Intelligent Head Hunting Service," Journal of Korea Multimedia Society, Vol. 21, No. 2, pp. 224-231, 2018. https://doi.org/10.9717/kmms.2018.21.2.224
- Ricci, Francesco, L. Rokach, and B. Shapira, Introduction to Recommender Systems Handbook, Recommender Systems Handbook, Springer, Boston, 2011.
- A. Albadvi and M. Shahbazi, "A Hybrid Recommendation Technique based on Product Category Attributes," Expert Systems with Applications, Vol. 36, No. 9, pp. 11480-11488, 2009. https://doi.org/10.1016/j.eswa.2009.03.046
- X.N. Lam, T. Vu, T.D. Le and A.D. Duong, "Addressing Cold Start Problem in Recommendation Systems," Proceedings of the 2nd International Conference on Ubiquitous Information Management and Communication, 2008.
- A. Elkahky, Y. Song, and X. He, "A Multiview Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems," Proceedings of the 24th International Conference on World Wide Web, International World Wide Web Conferences Steering Committee, pp. 278-288, 2015.
- D. Shankar, S. Narumanchi, H.A. Ananya, P. Kompalli, and K. Chaudhury, "Deep Learning based Large Scale Visual Recommendation and Search for E-commerce," arXiv Preprint, arXiv:1703.02344, 2017.
- H.T. Nguyen, M. Wistuba, J. Grabocka, L.R. Drumond, and L.S. Thieme, "Personalized Deep Learning for Tag Recommendation," Proceeding of Pacific-asia Conference on Knowledge Discovery and Data Mining, pp. 186-197, 2017.