• 제목/요약/키워드: 매칭함수

검색결과 124건 처리시간 0.027초

한국의 구인·구직 매칭함수 추정 (Estimation of Aggregate Matching Function in Korea)

  • 이대창
    • 노동경제논집
    • /
    • 제38권1호
    • /
    • pp.1-30
    • /
    • 2015
  • 한국의 구인 구직 매칭함수를 추정하였다. "사업체노동력조사"와 워크넷의 빈 일자리 수 과소 측정 문제를 극복하기 위해 채용동학모형을 통해 빈 일자리 잠재변수를 도출하고 이를 위한 도구변수를 매칭함수 추정에 활용하였다. 매칭 효율에 영향을 주는 구직자 속성과 공공고용서비스의 효과도 검증하였다. 구인 구직 매칭함수의 규모에 대한 수익불변(constant returns to scale)을 확인하였고, 매칭 효율은 구직자 중 전문대졸 학력자 비중과 정(+)의 상관관계를, 실업급여 수혜 비율과는 부(-)의 관계를 보였다.

  • PDF

내생성 문제를 완화한 한국의 매칭함수 추정 (Estimation of the Matching Function in Korea by Mitigating Endogeneity Problems)

  • 김지운
    • 노동경제논집
    • /
    • 제43권2호
    • /
    • pp.109-133
    • /
    • 2020
  • 본 논문에서는 Borowczyk-Martins et al.(2013)의 방식을 통해 내생성 문제를 완화하여 한국의 매칭함수를 추정하였다. 관측되지 않는 매칭 효율성을 ARMA(p,q) 과정으로 근사하고 일반적률(GMM) 추정법으로 내생성을 통제하였다. 2009년 6월부터 2019년 12월까지의 경제활동인구조사와 사업체노동력조사의 월 자료를 사용하여 한국의 매칭함수를 추정한 결과, 빈 일자리에 대한 채용의 탄력성을 나타내는 매칭 탄력성은 0.859로 나타났다. 정부의 직접 일자리 제공이 많았던 2019년 표본을 제외하고 추정한 경우 매칭 탄력성은 0.755로 낮아졌으나, 여전히 다른 국가의 매칭 탄력성보다는 높게 나타났다.

  • PDF

3D 콘텐츠 생성에서의 스테레오 매칭 알고리즘에 대한 매칭 비용 함수 성능 분석 (Performance Analysis of Matching Cost Functions of Stereo Matching Algorithm for Making 3D Contents)

  • 홍광수;정연규;김병규
    • 융합보안논문지
    • /
    • 제13권3호
    • /
    • pp.9-15
    • /
    • 2013
  • 스테레오 매칭 과정에 있어서 매칭 비용을 구하는 것은 매우 중요한 과정이다. 이러한 스테레오 매칭 과정의 성능을 살펴보기 위하여 본 논문에서는 기존에 제안된 매칭 비용 함수들에 대한 기본 개념들을 소개하고 각각의 성능 및 장점을 분석하고자 한다. 가장 간단한 매칭 비용 함수는 매칭 되는 영상의 일관된 밝기를 이용하여 좌, 우 영상 간 서로 대응하는 대응점을 추정하는 과정으로, 본 논문에서 다루는 매칭 비용함수는 화소 기반과 윈도우 기반의 매칭 비용 방법으로 크게 두 가지로 나눌 수 있다. 화소 기반의 방법으로는 절대 밝기차(the absolute intensity differences: AD)와 sampling-intensitive absolute differences of Birchfield and Tomasi (BT) 방법이 있고, 윈도우 기반의 방법으로는 차이 절대 값의 합(sum of the absolute differences: SAD), 차이 제곱 값의 합(sum of squred differences: SSD), 표준화 상호상관성(normalized cross-correlation: NCC), 제로 평균 표준화 상호 상관성(zero-mean normalized cross-correlation: ZNCC), census transform, the absolute differences census transform (AD-Census) 이 있다. 본 논문에서는 앞서 언급한 기존에 제안된 매칭 비용 함수들을 정확도와 시간 복잡도를 측정했다. 정확도 측면에서 AD-Census 방법이 평균적으로 가장 낮은 매칭 율을 보여줬고, 제로 평균 표준화 상호 상관성 방법은 non-occlusion과 all 평가 항목에서 가장 낮은 매칭 오차율을 보여 주지만, discontinuities 평가 항목에서는 블러 효과 때문에 높은 매칭 오차율을 보여 주었다. 시간 복잡도 측면에서는 화소 기반인 절대 밝기차 방법이 낮은 복잡도를 보여 주였다.

벤처기업정밀실태조사와 한국기업혁신조사 데이터를 활용한 통계적 매칭의 타당성 검증 (The Validity Test of Statistical Matching Simulation Using the Data of Korea Venture Firms and Korea Innovation Survey)

  • 안경민;이영찬
    • 지식경영연구
    • /
    • 제24권1호
    • /
    • pp.245-271
    • /
    • 2023
  • 최근 데이터 경제가 가속화되면서 경영학 분야에서는 데이터 매칭이라는 새로운 기법이 주목받고 있다. 데이터 매칭은 모집단이 같지만 서로 다른 표본에서 수집된 데이터셋을 합치는 기법 또는 처리 과정을 의미한다. 그중에서 통계적 매칭은 서로 다른 데이터를 결합하는데 있어서 사업자 번호와 같이 기준이 되는 변수가 없는 경우 통계적 함수를 활용하여 데이터를 매칭하는 방법이다. 선행연구 검토결과 경제학, 교육학, 보건, 의료 등 다양한 분야에서 통계적 매칭이 많이 사용되고 있는데 반해 경영학 분야는 제한적임을 확인할 수 있었다. 본 연구는 기존 경영학 분야에서 충분히 연구되지 않았던 통계적 매칭의 유용성을 검증하고 활용도를 높이는 방안을 연구하고자 한다. 연구목적을 달성하기 위해 본 연구에서는 2020 벤처기업정밀실태조사와 2020 한국기업혁신조사 자료를 활용하여 통계적 매칭 시뮬레이션을 수행하였다. 먼저, 선행연구를 바탕으로 통계적 매칭에 사용되는 변수를 선정하였다. 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수와 제공변수는 중소기업 혁신에서 가장 중요한 연구인력 비율과 R&D 비용으로 각각 설정하였다. 사전 검증을 위해 2020 벤처기업정밀실태조사 자료를 수여자 데이터 30%와 기여자 데이터 70%로 분할하였다. 통계적 매칭에는 마할라노비스 거리와 랜덤 핫덱을 결합한 방식을 사용하였고, 성능평가는 수여자 데이터와 원시 데이터의 평균값 비교와 커널 밀도 함수(Kernel Density Estimation)를 통해 데이터 분포를 비교하였다. 검증결과, 수여자 데이터 30%와 기여자 데이터 70%에서 추출된 매칭 데이터의 평균값이 통계적으로 유의한 차이가 없는 것으로 나타나 유사한 데이터가 매칭된다는 것을 확인하였다. 또한, 두 데이터의 커널 밀도 함수로 도출한 데이터 분포 역시 유사한 형태가 나타나는 것을 확인할 수 있었다. 사후 검증에는 2020 벤처기업정밀실태조사에서 임의로 30%를 수여자 데이터로 추출하고 2020 한국기업혁신조사 자료를 기여자 데이터로 설정하여 통계적 매칭을 수행하고 검증하였다. 사전 검증과 마찬가지로 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수는 연구 인력 비율과 R&D 비용으로 정의하였다. 분석 결과, 수여자 데이터의 연구인력 비율의 평균과 기여자 데이터의 평균은 예상과 다르게 통계적으로 차이가 있는 것으로 나타났다. 하지만 커널 밀도 함수에 따른 두 데이터의 분포는 유사한 형태를 보이는 것으로 조사되어 통계적 매칭의 적절성을 확인할 수 있었다. R&D 비용은 통계적 매칭 수행 결과, 수여자 데이터의 R&D 비용 평균과 기여자 데이터의 평균이 통계적으로 차이가 없었고, 커널 밀도 함수도 유사한 분포를 보이는 것으로 조사되었다. 이러한 결과는 모집단은 동일하지만 서로 다른 표본에서 수집된 자료를 통계적으로 결합하여 신뢰할 수 있는 새로운 데이터를 확보할 수 있다는 측면에서 큰 의의가 있다. 또한, 경영학 분야에서 많이 사용되지 않았던 데이터 매칭 방법론을 모의실험을 통해 타당성을 검증함으로써 연구용 데이터 확보와 연구방법론의 확장에 기여했다는 점에서 시사점을 가진다.

지연 함수형 프로그래밍 언어의 항 개서 의미 (Term Rewriting Semantics of Lazy Functional Programming Languages)

  • 변석우
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권3호
    • /
    • pp.141-149
    • /
    • 2008
  • 대부분의 함수형 프로그래밍 언어에서는 '위에서 아래쪽, 왼쪽에서 오른쪽 방향으로' 패턴 매칭(pattern matching)을 한다는 전략에 따라, 모호한(ambiguous) 특성을 갖는 룰의 정의를 허용하고 있다. 이 방법은 함수형 프로그래머에게 디폴트 룰을 정의할 수 있게 하는 직관적인 편리함을 제공하지만, 한편으로 모호한 룰 때문에 함수형 언어의 의미는 불명확해 질 수 있다. 좀 더 구체적으로, 함수형 언어가 갖는 대표적인 특성인 등식 추론(equational reasoning) 원리의 적용을 불가능하게 할 수 있으며, 함수형 언어를 람다 계산법으로 변환하는 데 있어서도 정형적인 방법이 아닌 임시방편적인(ad hoc) 방법에 의존할 수밖에 없게 한다. 본 연구에서는 지연(lazy) 함수형 언어의 패턴 매칭의 의미를 순수 선언적 특성을 갖는 항 개서 시스템(Term Rewriting Systems)의 분리성(separability) 이론과 연관시키고, 분리성 이론에 따라 지연 함수형 언어가 람다 계산법으로 변환될 수 있음을 보인다.

이종의 공간 데이터 셋의 면 객체 자동 매칭 방법 (Automated Areal Feature Matching in Different Spatial Data-sets)

  • 김지영;이재빈
    • 대한공간정보학회지
    • /
    • 제24권1호
    • /
    • pp.89-98
    • /
    • 2016
  • 본 연구에서는 축척과 갱신 주기가 상이한 이종의 공간 데이터 셋을 융합하기 위하여 사용자의 개입을 최소화하면서 다대다 관계에도 적용이 가능한 기하학적 방법론 기반의 면 객체 자동 매칭 방법을 제안하였다. 이를 위하여 첫째, 포함함수가 0.4 이상인 객체(노드)는 인접행렬에서 에지로 연결되었고, 이들 인접행렬의 곱을 반복적으로 수행하여 다대다 관계를 포함하는 후보 매칭 쌍을 선정하였다. 다대다 관계인 면 객체들은 알고리즘으로 생성된 convex hull로 단일 면 객체로 변환하였다. 기하학적 매칭을 위하여, 매칭 기준을 설정하고, 이들을 유사도 함수를 이용하여 유사도를 계산하였다. 다음으로 변환된 유사도와 CRITIC 방법으로 도출된 가중치를 선형 조합하여 형상 유사도를 계산하였다. 마지막으로 훈련자료에서 모든 가중치에 대한 정확도와 재현율을 나타낸 PR 곡선의 교차점인 EER로 임계값을 선정하고, 이 임계값을 기준으로 매칭 유무를 판별하였다. 제안된 방법을 수치지도와 도로명 주소기본도에 적용한 결과, 일부 다대다 관계에서 잘못 매칭되는 경우를 시각적으로 확인할 수 있었으나, 통계적 평가에서 정확도, 재현율, F-measure가 각각 0.951, 0.906, 0.928로 높게 나타났다. 이는 제안된 방법으로 이종의 공간 데이터 셋을 자동으로 매칭하는데 그 정확도가 높음을 의미한다. 그러나 일부 오류가 발생한 다대다 관계인 후보 매칭 쌍을 정확하게 정량화하기 위해서 포함함수나 매칭 기준에 대한 연구가 진행되어야 할 것이다.

이동 기반의 RMC을 이용한 자유형태 곡면 매칭방법 (The Matching of Free-Form surface using Motion-based RMC)

  • 박철호
    • 한국정보처리학회논문지
    • /
    • 제7권11호
    • /
    • pp.3544-3555
    • /
    • 2000
  • 매칭방법은 기하 및 입체 모델링에서 재단 곡면과 이들에 대한 부울 연산에 사용되는 기초적인 연산이다. 그러나 매칭연산은 부드러움을 정확하게 표현하는데 고 차수의 미분계수 제약조건으로 인하여 많은 계산량이 필요할 뿐만 아니라 곡면상의 여러 점을 동시에 선택하여 이동하였을 때, 곡면표현에 사용되는 복잡한 함수식으로 인하여 일반해를 구하기 어려운 단점을 가진다. 본 논문은 분수식에 의하여 RMC(Rotation-Minimizing Curve)을 정의하고 이를 이용하여 자유 형태 곡면간에 변형 매칭 방법을 제안한다. RMC는 매칭곡선과 곡면의 접선벡터, 회전벡터, 곡률의 변화율과 같은 기하학적 기법을 기반으로 한다. 제안한 방법은 입력으로 주어지는 곡면의 기하학적 복잡도와는 무관하게 매칭을 수행할 수 있으며 수행 성능은 계산된 매칭 곡선의 복잡도에 의해서만 좌우된다. 또한 곡선 표현에 사용된 값들을 정의된 매칭 곡선식에 그대로 적용할 수 있었으므로 최적화 응용 문제에 효율적으로 적용할 수 있다.

  • PDF

Haskell에서의 패키지 데이터 형 (Package Data Type in Haskell)

  • 장학상;권기항
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.760-762
    • /
    • 2004
  • 순수 함수형 프로그래밍 언어 Haskell에서의 데이터 추상은 대수 데이터형과 관련 함수로 묶어진 모듈의 인터페이스만을 노출함으로써 이루어진다. 이러한 데이터 추상에 대한 제한된 용법은 프로그램 설계에 있어 유용하게 사용되는 패턴 매칭을 제약하고, 파일 단위의 추상을 요구함으로써 데이터 구조 단위의 데이터 추상을 불가능하게 한다. 본 논문은 Haskell의 제한된 데이터 추상 문제를 해결하기 위한 방법으로 패키지 데이터형을 제안한다. 패키지 데이터형은 더 작은 단위로 데이터 추상을 가능하게 하고 패턴 매칭을 제악하지 않고 자유롭게 사용할 수 있게 한다.

  • PDF

타임 워핑 하의 효율적인 시계열 서브시퀀스 매칭을 위한 접두어 질의 기법의 확장 (Extension of the Prefix-Querying Method for Efficient Time-Series Subsequence Matching Under Time Warping)

  • 장병철;김상욱;차재혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.121-124
    • /
    • 2005
  • 본 논문에서는 타임 워핑 하의 시계열 서브시퀀스 매칭을 처리하는 방법에 대하여 논의한다. 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해 주는 변환이다. 접두어 질의 기법(prefix-querying method)는 착오 기각(false dismissal) 없이 타임 워핑 하의 시계열 서브시퀀스 매칭을 처리하는 인덱스를 이용한 최초의 방식이다. 이 방법은 사용자가 질의를 편리하게 작성하도록 하기 위하여 기본 거리 함수로서 $L_{\infty}$를 사용한다. 본 논문에서는 $L_{\infty}$ 대신 타임 워핑 하의 시계열 서브시퀀스 매칭에서 기본 거리 함수로서 가장 널리 사용되는 $L_1$을 적용할 수 있도록 접두어 질의를 확장한다. 또한, 제안된 기법으로 타임 워핑 하의 시계열 서브시퀀스 매칭을 수행하는 경우 착오 기각이 발생하지 않음을 이론적으로 증명한다. 다양한 실험을 통한 성능 평가를 통하여 본 연구에서 제시하는 기법의 우수성을 검증한다. 실험 결과에 의하면, 제안된 기법은 가장 좋은 성능을 보이는 기존의 기법과 비교하여 매우 뛰어난 성능 개선 효과를 보이는 것으로 나타났다.

  • PDF

메모리 효율적인 3군 매칭 알고리즘 구현 (Memory Efficient Tri-Matching Algorithm)

  • 김동길;정성재
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.393-394
    • /
    • 2020
  • 세 군 매칭을 수행하여 관찰 데이터를 구축하고 통계분석에 기반한 연구를 수행하는 경우가 종종 발생한다. 매칭작업은 각 군에 속한 개체의 성향점수를 서로 비교해 거리가 가까운 짝을 찾아야 하므로 카테시안 곱 만큼의 경우의 수를 따져야 하는 문제이고, 메모리 소요가 크다. 특히 세 군 매칭은 세 쌍의 거리가 가까운 triplet을 찾는 문제로, 세 개체 사이에 존재하는 세 개의 거리를 따져야 하기 때문에 메모리 소요가 두 군 매칭에 비해 훨씬 크다. 각 군에 속한 개체가 늘어나면 메모리소요가 기하 급수적으로 늘어나게 된다. R패키지에 포함된 TriMatch함수는 세 군 매칭 수행을 위해 가장 널리 사용되는 프로그램이다. 이 프로그램은 세 개체 사이의 세 개 거리가 가장 짧은 triplet을 찾는 방식으로 구현 되었다. 이 프로그램은 메모리 소요가 매우 커 각 군에 속한 개체의 수가 많아지면 메모리 부족 에러가 발생하는 경우가 많다. 본 연구에서는 세 군 매칭에 소요되는 메모리 소요를 줄일 수 있는 알고리즘을 제안하고자 한다. 이 알고리즘의 구현을 통해 각 군에 속한 개체가 늘어나도 안정적인 세 군 매칭 결과를 얻을 수 있을 것으로 기대한다.

  • PDF