[Tip] 시험환경에서 정당한 컨닝페이퍼 만들기 Guide
Explore and run machine learning code with Kaggle Notebooks | Using data from Big Data Certification KR
www.kaggle.com
빅데이터분석기사 실기 시험을 대비해서 실기 시험 기출문제를 찾다가 Big Data Certification KR 라는 캐글 데이터셋을 발견했다.
빅데이터분석기사 실기 시험을 준비할 때 참고할만한 자료가 모여있어서 공부할 때 도움이 될 것 같다.
특히 라이브러리 사용법이 헷갈릴 때 확인할 수 있는 법이 도움이 많이 되었다.
시험 환경에서는 인터넷 검색을 사용할 수 없어서 라이브러리 사용법을 알아두어야 한다고 생각했는데, 이 방법을 사용하면 인터넷 없이도 pandas, scikit-learn 함수의 사용법과 예제를 확인할 수 있다.
pandas 판다스
사용 가능한 함수 확인
import pandas as pd
print(dir(pd))
pandas DataFrame 데이터프레임 사용 가능한 attributes, methods 확인
print(dir(pd.DataFrame))
# ['T', '_AXIS_LEN', '_AXIS_NAMES', '_AXIS_NUMBERS', '_AXIS_ORDERS',
# '_AXIS_TO_AXIS_NUMBER', '_HANDLED_TYPES', '__abs__', '__add__', '__and__',
# '__annotations__', '__array__', '__array_priority__', '__array_ufunc__',
# '__array_wrap__', '__bool__', '__class__', '__contains__', '__copy__',
# '__deepcopy__', '__delattr__', '__delitem__', '__dict__', '__dir__', '__divmod__',
# '__doc__', '__eq__', '__finalize__', '__floordiv__', '__format__', '__ge__',
# '__getattr__', '__getattribute__', '__getitem__', '__getstate__', '__gt__',
# '__hash__', '__iadd__', '__iand__', '__ifloordiv__', '__imod__', '__imul__',
# '__init__', '__init_subclass__', '__invert__', '__ior__', '__ipow__', '__isub__',
# '__iter__', '__itruediv__', '__ixor__', '__le__', '__len__', '__lt__', '__matmul__',
# '__mod__', '__module__', '__mul__', '__ne__', '__neg__', '__new__', '__nonzero__',
# '__or__', '__pos__', '__pow__', '__radd__', '__rand__', '__rdivmod__', '__reduce__',
# '__reduce_ex__', '__repr__', '__rfloordiv__', '__rmatmul__', '__rmod__', '__rmul__',
# '__ror__', '__round__', '__rpow__', '__rsub__', '__rtruediv__', '__rxor__',
# '__setattr__', '__setitem__', '__setstate__', '__sizeof__', '__str__', '__sub__',
# '__subclasshook__', '__truediv__', '__weakref__', '__xor__', '_accessors',
# '_accum_func', '_add_numeric_operations', '_agg_by_level', '_agg_examples_doc',
# '_agg_summary_and_see_also_doc', '_align_frame', '_align_series', '_append',
# 'abs', 'add', 'add_prefix', 'add_suffix', 'agg', 'aggregate', 'align', 'all',
# 'any', 'append', 'apply', 'applymap', 'asfreq', 'asof', 'assign', 'astype', 'at',
# .
# .
# 'unstack', 'update', 'value_counts', 'values', 'var', 'where', 'xs']
사용 예제 확인
print(pd.DataFrame.size.__doc__)
# Return an int representing the number of elements in this object.
#
# Return the number of rows if Series. Otherwise return the number of
# rows times number of columns if DataFrame.
#
# See Also
# --------
# ndarray.size : Number of elements in the array.
#
# Examples
# --------
# >>> s = pd.Series({'a': 1, 'b': 2, 'c': 3})
# >>> s.size
# 3
#
# >>> df = pd.DataFrame({'col1': [1, 2], 'col2': [3, 4]})
# >>> df.size
# 4
scikit-learn 사이킷런
함수 확인
.__all__ 을 print 한다.
import sklearn.preprocessing
print(sklearn.preprocessing.__all__)
사용법 확인
help 를 print 한다.
import sklearn.preprocessing
print(help(sklearn.preprocessing.MinMaxScaler))
'IT' 카테고리의 다른 글
내가 보려고 정리한 빅데이터분석기사 실기 작업형 기출 복원 모음 (0) | 2023.06.03 |
---|---|
빅데이터분석기사 실기 시험 환경 (0) | 2023.06.03 |
[Streamlit] 스트림릿이란? 데이터분석 시각화 오픈소스 라이브러리 (0) | 2023.05.31 |
Pyspark를 위한 Java 설치 및 JAVA_HOME 환경변수 설정 (0) | 2023.05.24 |
데이콘 일기 (2) - matplotlib 한글 폰트 설정 (0) | 2023.05.14 |
댓글