NDC2017 2017. 5. 18. 14:03

게임 bot 탐지 모델 구현 및 응용사례
ex) 3초 안에 10개의 스테이지를 연속으로 클리어하면 어뷰저에요.
-> 군맹무상 : 자기의 좁은 소견으로 진실이라고 믿는다.

모바일 게임은 주 계정에서 봇을 사용한다. - 스스로 게임 플레이를 할 때도 있다.

기존 rule로 1주일 간의 최신 데이터를 확인해 보면 정확도도 낮고 높은 오진률 발생.

문제를 해결하는 가장 첫 번째 단계는 우리 스스로 문제가 있다는 것을 인식하는 것.

ex) 라인레인져스
레벨업 = 경험치 획득량 / 플레이 횟수 (X)
레벨업 = 경험치 획득량 / 경험치 획득 횟수+1

box plot
1사분위수 3사분위수 : 비교하는 그룹의 제 1사분위수와 제 3사분위수 사이의 구간이 완전하게 분리 된 것이 좋다.

feature selection이 필요한 이유
1. 관련 없는 데이터 제거
2. 모델 정확도와 관련된 feature 중요도 파악
3. feature는 꼭 필요한 것만 선택하는 것이 중요.

RFE를 꼭 알아두자..

RF Classifier / SVM Classifier

RFE는 feature를 재귀적으로 제거하고 남은 feature만으로 모델 정확도를 계산하여 목표 변수에 대한 예측에 기여하는 속성의 조합

PCA(Principal Component Analysis)는 왜 사용 안함?
1. 탐지 모델 생성과 검증을 위해 데이터 분할

2. Train data의 비율은 임의로 설정
- Undersampling 방식을 이용하여 80 : 20으로 조정 (Sampling, Cost-sensitive, Hybrid methods)

XGBOOST 알고리즘.
1. Computation in C++
2. R/Python 라이브러리(인터페이스) 제공
3. Tree-based 모델.

Ramdom Forest vs XGBoost


posted by 천마서생
: