본문 바로가기
IT

빅데이터분석기사 실기 시험환경에서 라이브러리 pandas sklearn 사용 방법 확인하기

by ShrimpTaco 2023. 6. 3.
반응형
 

[Tip] 시험환경에서 정당한 컨닝페이퍼 만들기 Guide

Explore and run machine learning code with Kaggle Notebooks | Using data from Big Data Certification KR

www.kaggle.com

빅데이터분석기사 실기 시험을 대비해서 실기 시험 기출문제를 찾다가 Big Data Certification KR 라는 캐글 데이터셋을 발견했다.

빅데이터분석기사 실기 시험을 준비할 때 참고할만한 자료가 모여있어서 공부할 때 도움이 될 것 같다.

특히 라이브러리 사용법이 헷갈릴 때 확인할 수 있는 법이 도움이 많이 되었다.

시험 환경에서는 인터넷 검색을 사용할 수 없어서 라이브러리 사용법을 알아두어야 한다고 생각했는데, 이 방법을 사용하면 인터넷 없이도 pandas, scikit-learn 함수의 사용법과 예제를 확인할 수 있다.

pandas 판다스

사용 가능한 함수 확인

import pandas as pd
print(dir(pd))

pandas DataFrame 데이터프레임 사용 가능한 attributes, methods 확인

print(dir(pd.DataFrame))


# ['T', '_AXIS_LEN', '_AXIS_NAMES', '_AXIS_NUMBERS', '_AXIS_ORDERS', 
# '_AXIS_TO_AXIS_NUMBER', '_HANDLED_TYPES', '__abs__', '__add__', '__and__', 
# '__annotations__', '__array__', '__array_priority__', '__array_ufunc__', 
# '__array_wrap__', '__bool__', '__class__', '__contains__', '__copy__', 
# '__deepcopy__', '__delattr__', '__delitem__', '__dict__', '__dir__', '__divmod__', 
# '__doc__', '__eq__', '__finalize__', '__floordiv__', '__format__', '__ge__', 
# '__getattr__', '__getattribute__', '__getitem__', '__getstate__', '__gt__', 
# '__hash__', '__iadd__', '__iand__', '__ifloordiv__', '__imod__', '__imul__', 
# '__init__', '__init_subclass__', '__invert__', '__ior__', '__ipow__', '__isub__', 
# '__iter__', '__itruediv__', '__ixor__', '__le__', '__len__', '__lt__', '__matmul__', 
# '__mod__', '__module__', '__mul__', '__ne__', '__neg__', '__new__', '__nonzero__', 
# '__or__', '__pos__', '__pow__', '__radd__', '__rand__', '__rdivmod__', '__reduce__', 
# '__reduce_ex__', '__repr__', '__rfloordiv__', '__rmatmul__', '__rmod__', '__rmul__', 
# '__ror__', '__round__', '__rpow__', '__rsub__', '__rtruediv__', '__rxor__', 
# '__setattr__', '__setitem__', '__setstate__', '__sizeof__', '__str__', '__sub__', 
# '__subclasshook__', '__truediv__', '__weakref__', '__xor__', '_accessors', 
# '_accum_func', '_add_numeric_operations', '_agg_by_level', '_agg_examples_doc', 
# '_agg_summary_and_see_also_doc', '_align_frame', '_align_series', '_append', 
#  'abs', 'add', 'add_prefix', 'add_suffix', 'agg', 'aggregate', 'align', 'all', 
# 'any', 'append', 'apply', 'applymap', 'asfreq', 'asof', 'assign', 'astype', 'at',
# .
# .
# 'unstack', 'update', 'value_counts', 'values', 'var', 'where', 'xs']

사용 예제 확인

print(pd.DataFrame.size.__doc__)

#        Return an int representing the number of elements in this object.
#
#        Return the number of rows if Series. Otherwise return the number of
#        rows times number of columns if DataFrame.
#
#        See Also
#        --------
#        ndarray.size : Number of elements in the array.
#
#        Examples
#        --------
#        >>> s = pd.Series({'a': 1, 'b': 2, 'c': 3})
#        >>> s.size
#        3
#
#        >>> df = pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]})
#        >>> df.size
#        4

scikit-learn 사이킷런

함수 확인

.__all__ 을 print 한다.

import sklearn.preprocessing
print(sklearn.preprocessing.__all__)

 

사용법 확인

help 를 print 한다.

import sklearn.preprocessing
print(help(sklearn.preprocessing.MinMaxScaler))

 

반응형

댓글