Мазмуну:

Негизги компоненттерди талдоо: 4 кадам
Негизги компоненттерди талдоо: 4 кадам

Video: Негизги компоненттерди талдоо: 4 кадам

Video: Негизги компоненттерди талдоо: 4 кадам
Video: Кантип тестти туура жана оңой иштесе болот? 2024, Ноябрь
Anonim
Негизги компоненттердин анализи
Негизги компоненттердин анализи

Негизги компоненттерди анализдөө - бул ортогоналдык трансформацияларды колдонуу менен мүмкүн болгон корреляцияланган өзгөрмөлөрдүн жыйындысын сызыктуу корреляцияланбаган баалуулуктардын жыйындысына айландыруучу статистикалык ыкма. Жөнөкөй сөз менен айтканда, бир нече өлчөмдөгү маалымат базасы берилген, бул өлчөмдөрдүн санын кыскартууга жардам берет, ошондуктан маалыматтарды окууну жеңилдетет.

1 -кадам: Оригиналдуу пландар

Мен бул класска сүрөттөр менен камсыз болгондо жүздү таанууну ишке ашыра турган алгоритмди түшүнгүм келет жана жазам деген ой менен келдим. Менде жүздү таануу боюнча эч кандай тажрыйба же билим жок болчу жана буга окшогон нерсеге жетүү канчалык кыйын экенин билчү эмесмин. Профессор Маллох менен сүйлөшкөндөн кийин, мен аягында жетүү үчүн пландаштырылган тапшырманы толук түшүнүүдөн мурун көп нерсени үйрөнүшүм керек экенин түшүндүм.

Бир аз изилдөө жүргүзгөндөн кийин, мен акыры, сызыктуу алгебраны жана машинаны үйрөнүүнүн кээ бир негиздерин үйрөнүшүм керек деп чечтим жана PCAга (негизги компоненттерди талдоо) бул класстын максаты болууну чечтим.

2 -кадам: Изилдөө

Изилдөө
Изилдөө

Биринчи кадам - китепканага келип, машинаны үйрөнүү жана тагыраагы сүрөттөрдү иштетүү менен тааныштырган китепти табуу. Бул мен ойлогондон алда канча оор болуп чыкты жана мен андан эч нерсе албай калдым. Анан мен Vision лабораториясында иштеген досумдан сызыктуу алгебрага жана тагыраак айтканда менчик векторлорго жана өздүк баалуулуктарга кайрылууну сурандым. Мен 2 -курста окуп жүргөн класстын сызыктуу алгебра боюнча тажрыйбам бар болчу, бирок сүрөттөр менен иштөөдө менчик векторлордун же өздүк баалуулуктардын канчалык пайдалуу экенин түшүнгөн жокмун. Мен көбүрөөк изилдеп жатып, сүрөттөр чоң маалымат топтомунан башка эч нерсе эмес экенин түшүндүм жана аларды матрицалар катары кароого болорун түшүндүм жана мен үчүн эмне үчүн менчик векторлордун тиешеси бар экенин түшүндүм. Бул жерде мен долбоорум үчүн python колдоно турган болсом, сүрөттөрдү python аркылуу окууну үйрөнүүм керек деп чечтим. Башында мен сүрөттөрдү окуу үчүн CV2.imreadти колдонуу менен баштадым, бирок бул чынында жай болуп чыкты, ошондуктан мен glob жана PIL.image.open колдонууну чечтим, анткени бул абдан тезирээк. Кагаздагы бул процесс салыштырмалуу көп убакытты талап кылбайт окшойт, бирок чындыгында көп убакытты талап кылды, анткени мен ар кандай китепканаларды PyCharmга (IDE) кантип орнотууну жана импорттоону үйрөнүшүм керек болчу, андан кийин ар бир китепкана үчүн документтерди онлайн аркылуу окуу керек болчу. Муну аткарууда мен ошондой эле командалык сапта pip install операторлорун колдонууну үйрөндүм.

Андан кийин, кийинки кадам мен эмнени жасоону жана сүрөттөрдү иштетүүнү үйрөнүүнү каалап жатканымды түшүнүү болчу, а мен башында шаблондорду дал келтирүүнү пландап жаткам, бирок аны изилдеп жатып мен ПКА жөнүндө билдим жана аны кызыктуу деп таптым, ошондуктан мен чечтим анын ордуна PCA менен баруу. Биринчи термин K-NN (K- эң жакын кошунасы) алгоритми болгон. Бул менин машинаны үйрөнүү алгоритмине биринчи жолу болгонум. Мен тренинг жана тестирлөө маалыматтары жана алгоритмдин "тренинги" эмнени билдирерин билдим. K-NN алгоритмин түшүнүү да кыйын болгон, бирок анын кантип иштээрин түшүнүү абдан канааттандырарлык болгон. Мен азыр K-NN иштөө үчүн коддун үстүндө иштеп жатам жана мен аяктоо алдында турам.

3 -кадам: Кыйынчылыктар жана алынган сабактар

Биринчи чоң кыйынчылык - бул долбоордун масштабы. Бул физикалык нерсеге караганда көбүрөөк изилдөөгө багытталган. Бир нече жума өткөн сайын мен теңтуштарымдын жетишкендиктерин карап, жетишерлик иш кылбай жатканымды же жетишерлик тез ылдамдыкка жетпей жатканымды сезип, кээде демотивациялоочу болчумун. Профессор Маллох менен сүйлөшүп, чынында мен үчүн жаңы нерселерди үйрөнүп жатам деп өзүмдү ишендирүүмдү улантууга жардам берди. Дагы бир көйгөй - теориялык нерселерди билүү жана аны колдонуу эки башка нерсе. Мен эмне кылышым керек экенин билсем да, чындыгында аны питондо коддоо - бул башка окуя. Бул жерде интернеттеги документтерди окуу жана бул тууралуу көбүрөөк билген достордон сурануу, акыры иш планын аныктоого көп жардам берди.

Жеке менимче, M5те китептердин жана документтердин чоңураак китепканасынын болушу долбоорлордо иштеген адамдарга жардам берет деп ойлойм. Башка студенттер жана кызматкерлер аны карап, кызыктырса катыша алышы үчүн студенттер тарабынан аткарылып жаткан долбоорлордун реалдуу убакыт режиминде санариптик жазуусу бар M5 үчүн жакшы идея.

Долбоор аяктаганда мен кыска убакыттын ичинде көп нерсени үйрөндүм. Мен машина үйрөнүү боюнча абдан жакшы билимге ээ болдум жана ага көбүрөөк катышуу үчүн биринчи кадамдарды жасагандай сезем. Мен компьютердин көрүүсүн жакшы көрөрүмдү жана келечекте дагы бул багытта иштөөнү каалаарымды түшүндүм. Эң негизгиси мен PCA деген эмне экенин, эмне үчүн бул өтө маанилүү экенин жана аны кантип колдонууну үйрөндүм.

4 -кадам: Кийинки кадамдар

Мен үчүн бул жөн гана алда канча кененирээк нерсени жана азыркы дүйнөдө абдан маанилүү болгон нерсени тырмап алуу болду, б.а. машина үйрөнүү. Мен жакын арада машина үйрөнүүгө байланыштуу курстарды алууну пландап жатам. Мен дагы жүздү таанууга чейин жол курууну пландап жатам, анткени бул жерде бүт долбоор башталган. Менде коопсуздук системасы үчүн идеяларым бар, алар комбинацияланган функцияларды колдонот (алардын бири адамдын жүзү) жана аны чындап коопсуз кылуу үчүн, мен келечекте нерселерди кеңири түшүнгөндө иштегим келет..

Мага окшогон машиналарды үйрөнүүгө жана сүрөттөрдү иштетүүгө кызыккан, бирок буга чейин тажрыйбасы жоктор үчүн мен биринчи кезекте сызыктуу алгебраны үйрөнүүнү жана статистиканы (айрыкча бөлүштүрүүнү) сунуштайт элем. Экинчиден, Кристофер М. Бишоптун Үлгү таануу жана Машина үйрөнүүнү окууну сунуштайт элем. Бул китеп мага эмне кылып жатканымдын негиздерин түшүнүүгө жардам берди жана абдан жакшы структураланган.

Сунушталууда: