IT 인터넷/GA(구글 애널리틱스)

데이터 라벨링 교육 배워둬야 하는 이유(크라우드웍스)

호기심클럽장 2022. 9. 5. 19:22
728x90
반응형

크라우드웍스에서 내일배움카드를 통해서 교육을 듣고 있습니다. 

물론 교육을 듣는 이유는 내일배움카드로 하면 공짜이기도 하고 최근에 데이터, 코딩, 플랫폼 이런 키워드에 제가 꽂혀있기도 하기에 관련 교육들을 듣고 있어요, 그래서 그런지 강의만 들어도 굉장히 재미있었어요

 

 

▶인공지능: 사고나 학습 등 인간이 가진 지적 능력을 컴퓨터를 통해 구현하는 기술

 

▶머신러닝: 컴퓨터가 스스로 학습하여 인공지능의 성능을 향상시키는 기술 방법

-지도학습: 레이블(정답)이 있는 데이터를 가지고 학습하는 방법

-비지도학습: 레이블(정답)이 없는 데이터로 학습하는 방법

-강화학습: 시행착오를 통해 학습하는 방법

 

▶딥러닝: 인간의 뉴런과 비슷한 인공신경망 방식으로 정보를 처리

 

#데이터로 본 AI

▶데이터 전처리: 분석에 적합하게 데이터를 가공하는 작업

▶데이터 라벨링: AI가 학습을 할 수 있도록 데이터에 이름(라벨)을 붙이는 작업

 

#AI와 인간은 적인가? 친구인가?

늘 그렇듯 내 생각은 '적당히' 이용하면 득이 되고 과하게 이용하면 해가 된다는 것이다. 

그리고 나는 AI가 우리 생활을 지배할 그 날이 올것이라고 확신한다. AI가 감정을 읽게 되면 인간은 파별할 것이다. 너무 영화적인 마인드 라고 생각할 수도 있겠지만 그만큼 AI의 발전 속도가 너무 빠르다고 생각하기 떄문이다.

 

#우리 생활 속 인공지능: 우리가 쓰는 거의 모든 생활용품에 다 쓰이고 있다.

-아마존의 물류 로봇

-테슬라의 오토파일럿

-넷플릭스/유튜브의 추천시스템

-아이폰의 단어 자동완성

-인공지능 스피커

 

 

#AI가 정말 우리 삶과 직업을 침해하고 있을까

인공지능은 공존을 위한 토대 위에 진행되어야 할 것 같다.실제 산업별 일자리 변화를 따져보니 생각보다 감소세가 크지 않았다 라는 결과가 나왔다고 한다.전반적으로 생겨나는 일과 없어지는 일의 양이 비슷하다. 일의 행태나 구성은 변할지 몰라도 일자리 숫자 변화는 크지 않았다.

 

# 미래를 어떻게 준비해야 할까

플랫폼 노동 자체에 대한 관심으로 이어졌다. 플랫폼 노동은 디지털 플랫폼을 기반으로 이루어지는 노동이다. (배달 운전 프로그래밍, 번역, 데이터 라벨링 등 다양한 형태로 변화가 되어 증가하는 추세이다)

플랫폼 노동은 생각보다 다양하고 광범위하다. 노동부는 2가지 유형으로 구분해놓았다

-웹기반: 노무제공이 온라인 상에서 이루어짐(디자인, 마케팅, 번역, IT 개발 등 전문분야)

-지역기반: 서비스는 특정지역에서 이루어짐(배달, 가사 등)

 

플랫폼 종사자들에대한 권익보호에 대한 관심도 늘어나고 있다.

비밀유지의무(개인 정보를 취급하거나 일정한 업무에 종사하는 사람이 직무상 알게 된 개인 정보를 지킬 의무)를 위반하거나 잘못하면 손해배상을 물을 수도 있고, 저작권이나 초상권 침해 등으로 이어질 수 있다.

 

#데이터 라벨러에게 발생될 수 있는 문제

-작업화면 유출

-신청 또는 병경 시 허위내용등록

-타인의 정보 도용

-회사가 게시한 정보의 변경

 

AI기술이 사회곳곳에 퍼져 인간의 생활을 더 윤택하게 해주는 방향을 지향해야 겠다.

그렇다면 본격적으로 데이터 라벨링이란 무엇일까

 

인공지능은 각각의 데이터가 무엇을 의미하는지를 학습시켜야 한다.

동영상 이미지 음성 텍스트 드으이 데이터를 인공지능 학습을 위해 분류하고 가공하는 모든 작업을 데이터 라벨링 작업이라고 한다. 그만큼 정교하게 가공된 데이터로 AI를 학습시켜야 하기 때문에 라벨링이 꼭 필요하다.

 

#유형별 프로젝트(저작권 문제 주의)

-이미지

-영상

-텍스트

-음성

 

 

#가공작업

-바운딩: 이미지에서 정해준 색션에 박스를 그린 후 분류하는 작업, 태깅을 진행한다.

-키포인트 추출: 대상의 특정부위에 점을 찍는 작업(가공된 데이터는 이미지나 객체를 구별하는데 활요예

-OCR: 화면 이미지 내 글자를 바운딩 해 글자를 입력하는 프로젝트.글자 바운딩 기준은 작업 기준을 꼭 가이드에서 자세히 확인해야 한다.

-얼굴 랜드마크: 얼굴의 눈 코 입 눈썹등 사람의 얼굴을 인식하고 표정변화를 알아내는데 활용한다

-영상에서 특정 구간을 구분하는 작업. 구간 추출후 감정을 표현하거나 대사를 묘사한다

-텍스트 수집으로 기계독해엔진이나 챗봇에 활용

 

 

 

 

 

 

 

반응형