• 제목/요약/키워드: datasets

검색결과 2,012건 처리시간 0.023초

아까시나무 임분의 시계열적 생장 모니터링 및 벌기령 도출 (Periodic Growth Monitoring and Final Age at Maturity in a Robinia pseudoacacia Stand)

  • 김재엽;김소라;송정은;성상민;임종수;손영모
    • 한국산림과학회지
    • /
    • 제111권4호
    • /
    • pp.613-621
    • /
    • 2022
  • 본 연구는 5차, 6차, 7차 국가산림조사 자료 중 아까시나무가 우점종인 표본점을 수집하여, 산림조사 차수별, 기후대별(온대 북부, 온대중부, 온대남부, 난대지역), 해발고별(100 m 단위) 흉고직경, 입목본수, ha당 재적 및 지위지수의 변화를 구명하고자 하였다. 또한 용재로서 사용을 위한 기준인 벌기령을 산정하였다. 그리고 변화 구명은 통계처리 기법 중 분산분석과 Duncan 검정으로서 이행하였다. 흉고직경의 변화를 보면, 당연히 산림조사 차수에 따라 증가하였고, 기후대별로는 온대남부 지역에서 가장 생장이 좋지 않았으며, 해발고별로는 301-400 m 지점에서 가장 생장이 떨어지는 것으로 나타났다. ha당 입목밀도는 산림조사 차수별, 해발고에 따라서 서로 간 차이를 보이지 않았으며, 온대중부 지역에서 밀도가 가장 높고, 온대남부 지역이 가장 낮은 밀도를 보였다. ha당 임분재적은 산림조사 차수에 따라 증가하였고, 온대북부·온대중부 지역과 온대남부·난대 지역으로 크게 두 그룹으로 구분되며, 해발고 201-300 m에서 재적생장량이 가장 높았다. 지위지수는 ha당 임분재적 변화와 유사한 결과를 보여 주었다. 그리고 아까시나무의 ha당 재적변화를 알 수 있는 생장량 곡선은 Weibull 함수식으로 추정하였으며, 임분재적은 임령 50-60년에 이를 때 약 200 m3에 달할 것으로 예측되었다. 아까시나무를 밀원 자원이 아닌 용재로 이용하기 위한 기준인 재적수확최대벌기령을 계산한 결과 34년으로 나타났다.

역 원근변환 기법을 이용한 터널 영상유고시스템의 원거리 감지 성능 향상에 관한 연구 (A study for improvement of far-distance performance of a tunnel accident detection system by using an inverse perspective transformation)

  • 이규범;신휴성
    • 한국터널지하공간학회 논문집
    • /
    • 제24권3호
    • /
    • pp.247-262
    • /
    • 2022
  • 국내 200 m 이상 연장의 터널에서는 CCTV 설치가 의무화되어 있으며, 터널 내 돌발 상황을 자동으로 인지한 다음 터널 관리자에게 알릴 수 있는 터널 영상유고시스템의 운영이 권고된다. 여기서 터널 내 설치된 CCTV는 터널 구조물의 공간적인 한계로 인해 낮은 높이로 설치된다. 이에 따라 이동차량과 매우 인접하므로, 이동차량과 CCTV와의 거리에 따른 원근현상이 매우 심하다. 이로 인해, 기존 터널 영상유고시스템은 터널 CCTV로부터 멀리 떨어질수록 차량의 정차 및 역주행, 보행자 출현 및 화재 발생과 같은 터널 내 유고상황을 인지하기 매우 어려우며, 100 m 이상의 거리에서는 높은 유고상황 인지 성능을 기대하기 어려운 것으로 알려져 있다. 이 문제를 해결하기 위해 관심영역 설정 및 역 원근변환(Inverse perspective transform)을 도입하였으며, 이 과정을 통해 얻은 변환영상은 먼 거리에 있는 객체의 크기가 확대된다. 이에 따라 거리에 따라 객체의 크기가 비교적 일정하게 유지되므로, 거리에 따른 객체 인식 성능과 영상에서 보이는 차량의 이동속도 또한 일관성을 유지할 수 있다. 이를 증명하기 위해 본 논문에서는 터널 CCTV의 원본영상과 변환영상을 바탕으로 동일한 조건을 가지는 데이터셋을 각각 제작 및 구성하였으며, 영상 내 차량의 실제 위치의 변화에 따른 겉보기 속도와 객체 크기를 비교하였다. 그 다음 딥러닝 객체인식 모델의 학습 및 추론을 통해 각 영상 데이터셋에 대한 거리에 따른 객체인식 성능을 비교하였다. 결과적으로 변환영상을 사용한 모델은 200 m 이상의 거리에서도 객체인식 성능과 이동차량의 유고상황 인지 성능을 확보할 수 있음을 보였다.

우리나라 주변 바다의 산성화 현황과 영향 요인 분석 (A Review on Ocean Acidification and Factors Affecting It in Korean Waters)

  • 김태욱;김동선;박근하;고영호;모아라
    • 한국지구과학회지
    • /
    • 제43권1호
    • /
    • pp.91-109
    • /
    • 2022
  • 해양은 대기로 배출된 이산화탄소의 30% 가량을 흡수하여 대기 중 이산화탄소 농도를 감소시키는 역할을 하였으나, 이 때문에 해양의 pH와 탄산염 이온(CO32-)이 감소하는 해양산성화 현상을 겪고 있다. 본 논문에서는 황해 연안역의 신규 관측자료를 타 해역에서 획득된 기존 연구자료와 합쳐서 우리나라 주변 해역의 해양산성화 현황을 파악하고자 하였다. 우리나라 주변의 황해, 동해, 동중국해(남해 포함)는 대기 중 이산화탄소를 흡수하고 있으나, 외해 대부분의 해역에서 해양산성화의 지표인 아라고나이트 포화도가 1 이상인 것으로 나타났다. 남해 동부 연안역에서는 담수 공급으로 인한 희석과 성층 형성, 생물에 의한 유기물 생성과 분해가 표층과 저층의 계절적 해양산성화 변동에 큰 영향을 끼쳤다. 진해만은 빈산소화 현상, 광양만은 담수로 인한 희석으로 여름철 광범위한 해역에서 아라고나이트 포화도가 1 미만으로 감소하여, 탄산칼슘 패각(CaCO3 shell)을 가진 생물들에게 잠재적 위협이 될 것으로 보고되었다. 하지만 담수 유입이 많은 황해 연안역에서는 진해만과 광양만과 같이 뚜렷하고 광범위한 산성화는 발견되지 않았기 때문에, 연안역에서는 각 해역별 특성에 따라 해양산성화의 양상을 진단해야 할 필요가 있었다. 우리나라 동해 남서부 해역의 계절적 용승 현상 역시 해양산성화에 영향을 미칠 수 있다. 이런 계절적 요인과 더불어, 대기 중의 이산화탄소 및 산성물질이 해양으로 계속 유입되면서, 우리나라 바다의 아라고나이트 포화도가 지속적으로 감소할 것으로 예상된다. 따라서 해양산성화로부터 수산자원과 해양생태계를 보호하기 위해 향후 체계적인 해양산성화 모니터링을 강화해야 할 것이다.

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.

토지피복 지도와 식생 배출계수가 오존농도 모의에 미치는 영향 (Influence of Land Cover Map and Its Vegetation Emission Factor on Ozone Concentration Simulation)

  • 김경수;이승재
    • 한국농림기상학회지
    • /
    • 제25권1호
    • /
    • pp.48-59
    • /
    • 2023
  • 본 연구에서는 새롭게 개발된 식생의 BVOCs 배출계수를 기반으로 MEGANv2.1을 구동 후 BVOCs 배출량을 산출하여 질소산화물과의 결합을 통해 대류권 오존농도에 어떠한 영향을 미치는지 분석하고 그에 대한 신뢰성을 검토하고자 한다. BVOCs 대상물질은 이소프렌(Isoprene)과 모노테르펜(Monoterpenes)으로 한정하였고, 모델링 도메인의 공간적 범위는 남한지역을 포함하는 한반도의 남부(위도 : 32.8N~39.3N, 경도 : 123.4E~130.9E)와, 시간은 2008년 5월 1일부터 6월 30일까지를 대상으로 하였다. 식생 BVOCs 배출 모델의 입력자료를 생성하기 위해 토지피복 자료는 MODIS (MODerate resolution Imaging Spectroradiometer)의 MCD12Q1 (Land Cover type 5, PFT)와 환경부의 중분류 토지피복도를 사용하였고, 엽면적지수 자료는 MODIS의 MCD15A2를 사용하였다. 또한, 인위적 활동에 의한 배출량을 산출하기 위해 사용된 모델은 SMOKE-Asia 1.20 버전(Woo et al., 2009)이며, 오존농도를 모의하기 위해 CAMx v6.0 모델을 사용하였다. 연구의 진행은 1) 기존에 우리나라에서 측정된 식생 배출 값들을 조사하여 새로운 식생 배출계수를 BVOCs 배출모델에 적용하고, 2) GIS S/W을 이용하여 식생 배출모델(MEGAN)에 사용되는 입력자료를 생성하고, 3) MEGANv2.1을 구동하여 식생 배출량을 산출하고, 4) 인위적 배출을 산출하는 모델(SMOKE-Asia)을 구동하여 나온 인위적 배출량과 식생 배출량을 결합하여 대기화학 수송 모델(CAMx)의 입력자료로 사용하고, 5) 대기화학 수송 모델에서 구동된 오존농도의 결과 값을 실제 측정 값과 비교하여 식생 배출량 결과의 적정성에 대해 검토하였다. CAMx 모델을 통해 5개의 시나리오(인위적+식생 VOCs 배출 시나리오 4개 : A, B, C, D / 인위적 VOCs 배출 시나리오 1개 : E)에 대해 오존 생성농도를 비교한 결과, 본 연구에서 새롭게 적용한 식생 배출계수와 MODIS PFT를 사용한 시나리오 C에서 오존농도가 가장 높게 모의되었고, 인위적 VOCs 배출만을 고려한 시나리오 E보다 지역별로는 최대 53ppb, 도메인 평균으로는 2ppb 정도 높게 오존농도를 모의하고 있었다. 배출계수와 토지피복지도의 변화로 인한 오존농도의 차이 중에서는 배출계수의 변화로 인한 오존농도의 변화가 더 큰 것으로 확인되었다. 오존농도에 대해 모델링한 결과를 6개 도시지역의 오존 측정망 값과 비교한 결과, 자연적 VOCs 배출량이 상대적으로 작은 대도시와 주변 도시지역에서는 시나리오에 따른 모델과 측정 값과의 결정계수 값의 변화가 작게 나타났고, 자연적 VOCs 배출량이 높은 중소 도시지역에서는 시나리오에 따른 모델과 측정 값과의 결정계수 변화가 높게 나타났다.

메콩강 유역의 격자형 강수 자료에 의한 강우-유출 모의 성능 비교·분석 (Comparison of rainfall-runoff performance based on various gridded precipitation datasets in the Mekong River basin)

  • 김영훈;레수안히엔;정성호;연민호;이기하
    • 한국수자원학회논문집
    • /
    • 제56권2호
    • /
    • pp.75-89
    • /
    • 2023
  • 강우-유출 해석은 하천 홍수예경보, 댐 유입량 산정 및 방류량 결정 등 수자원 관리 및 계획수립에 있어 중요한 과정이며, 밀도높은 강우관측망으로부터 수집된 강우 자료는 정확한 강우-유출 해석을 위한 가장 중요한 기초 자료로 활용된다. 본 연구 대상 지역인 메콩강 유역은 국가공유하천으로 강수 자료수집이 어렵고, 구축된 자료의 양적, 질적 품질이 국가별로 상이하여 수문해석 결과의 불확실성을 높일 우려가 있다. 최근 원격탐사 기술의 발달로 격자형 글로벌 강수자료의 획득이 용이해졌으며, 이를 활용한 미계측 유역 또는 대유역에서의 다양한 수문해석 연구들이 수행된 바 있다. 본 연구에서는 미계측 대유역 수문해석에 있어 격자형 강수자료의 적용성을 평가하기 위하여 3개의 위성 강수자료(TRMM, GSMaP, PERSIANN-CDR)와 2개의 지점 격자형 강수자료(APHRODITE, GPCC)를 수집하고, APHRODITE를 관측값으로 합성곱 신경망 모형인 ConvAE 알고리즘을 이용하여 위성 강수자료의 시·공간적 편의보정을 수행하였다. 또한, 메콩강 본류의 주요지점인 Luang Prabang, Pakse, Stung Treng, Kratie 4개 수위 관측소를 선정하여 SWAT 모형의 매개변수를 보정(2004~2011)하고 지점 격자형 강수자료 및 위성 강수자료의 보정전·후의 유출모의(2012~2013) 결과를 비교·분석하였다. 그 결과 원시위성 강수자료 및 GPCC는 APHPRODITE에 비해 정량적으로 과소 또는 과대추정되거나 공간적으로 매우 상이한 패턴을 나타낸 반면, GSMaP과 ConvAE를 이용하여 보정된 위성 강수자료의 경우, APHPRODITE에 대한 시·공간적 상관성이 개선된 것으로 분석되었다. 또한 유출모의의 경우, 모든 지점에 대해서 ConvAE로 보정된 위성 강수자료를 이용한 유출모의 결과가 원시 위성강수자료를 이용한 유출결과 보다 정확도가 향상된 것으로 분석되었다. 따라서 본 연구에서 제시하는 격자형 위성 강수자료 보정기법과 연계한 강우-유출 해석은 향후 다양한 위성 강수자료를 활용한 미계측 대유역 수문해석에서 활용이 가능할 것으로 판단된다.

저화질 안면 이미지의 화질 개선를 통한 안면 특징점 검출 모델의 성능 향상 (Enhancing the performance of the facial keypoint detection model by improving the quality of low-resolution facial images)

  • 이경욱;이예진;박종혁
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.171-187
    • /
    • 2023
  • 저화소의 감시카메라와 같은 촬영 장비를 통해 사람의 얼굴을 인식할 경우, 화질이 낮아 얼굴을 포착하기 어렵다는 문제점이 있다. 이렇게, 사람의 얼굴을 인식하기 어렵다면 범죄용의자나 실종자를 특정해내지 못하는 등의 문제가 발생할 수 있다. 기존 이미지 속 안면 인식에 관한 연구들에서는 정제된 데이터셋을 사용하였기 때문에 다양한 환경에서의 성능을 가늠하기 어렵다는 한계가 존재한다. 이에, 본 논문에서는 저화질 이미지에서 안면 인식 성능이 떨어지는 문제를 해결하기 위해 다양한 환경을 고려한 저화질 안면 이미지에 대해 화질 개선을 수행하여 고화질 이미지를 생성한 뒤, 안면 특징점 검출의 성능 향상시키는 방법을 제안한다. 제안 방법의 현실 적용 가능성을 확인하기 위해 전체 이미지에서 사람이 상대적으로 작게 나타나는 데이터셋을 선정하여 실험을 수행하였다. 또한 마스크 착용 상황을 고려한 안면 이미지 데이터셋을 선정하여, 현실 문제로의 확장 가능성을 탐구하였다. 안면 이미지의 화질을 개선하여 특징점 검출 모델의 성능을 측정한 결과, 개선 후 안면의 검출 여부는 마스크를 착용하지 않은 이미지의 경우 평균 3.47배, 마스크를 착용한 경우 평균 9.92배로 성능 향상을 확인할 수 있었다. 안면 특징점에 대한 RMSE는 마스크를 착용한 이미지의 경우 평균 8.49배 감소, 마스크를 착용하지 않은 경우 평균 2.02배 감소한 것을 확인할 수 있었다. 이에, 화질 개선을 통해 저화질로 포착된 안면 이미지에 대한 인식률을 높여 제안 방법의 활용 가능성을 확인할 수 있었다.

심층신경망 기반의 해수 고유광특성 도출 (Derivation of Inherent Optical Properties Based on Deep Neural Network)

  • 이형탁;최혜민;김민규;윤석;김광석;문정언;한희정;박영제
    • 대한원격탐사학회지
    • /
    • 제39권5_1호
    • /
    • pp.695-713
    • /
    • 2023
  • 연안 해역에서 식물성플랑크톤, 부유입자, 용존유기물은 복합적이고 비선형적으로 해수반사도를 변화시킨다. 최근 빠르게 발전하는 신경망 기술은 복잡한 비선형 관계를 효과적으로 처리할 수 있는 장점이 있다. 기존 연구에서는 성분별 고유광특성을 도출하기 위하여 세 단계의 신경망을 구성하였으나 본 연구에서는 심층신경망을 직접 적용하는 알고리즘을 제안하였다. 본 연구에서 활용한 데이터세트는 국제해색조정그룹에서 제공하는 합성데이터를 활용하였으며, 입력데이터는 9개의 파장의 원격반사도를 입력하였다. 이를 통해 해수 고유광특성을 심층신경망을 기반으로 도출하였다. 성능을 평가하기 위해 준분석 알고리즘(quasi-analytical algorithm)과 비교하였으며, 데이터 분포에 따른 로그 변환 여부가 심층신경망 알고리즘의 성능에 영향을 미치는 정도를 비교 분석하였다. 그 결과, 준분석 알고리즘보다 심층신경망 알고리즘을 활용하면 부유입자에 대한 흡광계수를 제외한 고유광특성을 정확하게 추정할 수 있으며(R2 0.9 이상), 부유입자와 용존유기물의 흡광계수를 부유입자와 용존유기물 흡광계수로 각각 분리할 수 있었다. 그리고 심층신경망을 직접적으로 적용하는 알고리즘은 데이터의 로그 변환을 하지 않아도 성능 차이가 거의 없음을 파악할 수 있었다. 이 연구 결과를 해색 자료 처리에 실제 적용하기 위해서는 다양한 해역의 현장자료 및 추가적인 데이터 세트를 활용한 학습을 진행하여, 경험적 및 반분석적 방법과 비교 분석하고 알고리즘 간 장단점을 적절히 파악하는 연구가 필요하다.

Overcoming taxonomic challenges in DNA barcoding for improvement of identification and preservation of clariid catfish species

  • Piangjai Chalermwong;Thitipong Panthum;Pish Wattanadilokcahtkun;Nattakan Ariyaraphong;Thanyapat Thong;Phanitada Srikampa;Worapong Singchat;Syed Farhan Ahmad;Kantika Noito;Ryan Rasoarahona;Artem Lisachov;Hina Ali;Ekaphan Kraichak;Narongrit Muangmai;Satid Chatchaiphan6;Kednapat Sriphairoj;Sittichai Hatachote;Aingorn Chaiyes;Chatchawan Jantasuriyarat;Visarut Chailertlit;Warong Suksavate;Jumaporn Sonongbua;Witsanu Srimai;Sunchai Payungporn;Kyudong Han;Agostinho Antunes;Prapansak Srisapoome;Akihiko Koga;Prateep Duengkae;Yoichi Matsuda;Uthairat Na-Nakorn;Kornsorn Srikulnath
    • Genomics & Informatics
    • /
    • 제21권3호
    • /
    • pp.39.1-39.15
    • /
    • 2023
  • DNA barcoding without assessing reliability and validity causes taxonomic errors of species identification, which is responsible for disruptions of their conservation and aquaculture industry. Although DNA barcoding facilitates molecular identification and phylogenetic analysis of species, its availability in clariid catfish lineage remains uncertain. In this study, DNA barcoding was developed and validated for clariid catfish. 2,970 barcode sequences from mitochondrial cytochrome c oxidase I (COI) and cytochrome b (Cytb) genes and D-loop sequences were analyzed for 37 clariid catfish species. The highest intraspecific nearest neighbor distances were 85.47%, 98.03%, and 89.10% for COI, Cytb, and D-loop sequences, respectively. This suggests that the Cytb gene is the most appropriate for identifying clariid catfish and can serve as a standard region for DNA barcoding. A positive barcoding gap between interspecific and intraspecific sequence divergence was observed in the Cytb dataset but not in the COI and D-loop datasets. Intraspecific variation was typically less than 4.4%, whereas interspecific variation was generally more than 66.9%. However, a species complex was detected in walking catfish and significant intraspecific sequence divergence was observed in North African catfish. These findings suggest the need to focus on developing a DNA barcoding system for classifying clariid catfish properly and to validate its efficacy for a wider range of clariid catfish. With an enriched database of multiple sequences from a target species and its genus, species identification can be more accurate and biodiversity assessment of the species can be facilitated.