신경망이란 무엇입니까?

더 일반적으로 신경망(NN)이라고 하는 인공 신경망(ANN)은 인간의 두뇌를 구성하는 생물학적 신경망에서 영감을 받은 컴퓨팅 시스템입니다.

신경망 다이어그램

신경망: 간략한 역사

신경망은 새롭고 흥미로운 것으로 보일 수 있지만 그 분야 자체는 전혀 새로운 것이 아닙니다. 미국 심리학자 프랑크 로젠블라트(Frank Rosenblatt)는 1958년에 인간의 마음처럼 반응하는 기계를 개념화했으며 그런 기계를 만들려고 시도했습니다. 그는 그 기계 이름을 "퍼셉트론"이라고 명명했습니다.

인공 신경망은 모든 실용적인 목적을 위해 생물학적 대응물과 유사한 방식을 예시로 학습합니다. 외부 입력은 인간의 두뇌와 동일한 방식으로 수신, 처리 및 작동됩니다.

신경망의 계층 구조

우리는 인간 두뇌의 여러 부분이 다양한 종류의 정보를 처리하도록 연결되어 있다는 것을 알고 있습니다. 뇌의 이러한 부분은 수준에서 계층적으로 배열됩니다. 정보가 뇌에 입력되면 신경 세포의 각 계층 또는 수준은 들어오는 정보를 처리하고 통찰력을 도출하며 다음 상위 계층으로 전달하는 특정 작업을 수행합니다. 예를 들어, 빵집을 지나갈 때 두뇌는 갓 구운 빵의 향기에 다음과 같은 단계로 반응합니다.

  • 데이터 입력: 갓 구운 빵 냄새
  • 생각: 어린 시절의 추억
  • 의사 결정: 그 빵을 사겠다는 생각
  • 기억: 하지만 이미 점심을 먹었다는 생각
  • 추리: 어쩌면 나는 간식을 먹을 수 있다는 생각
  • 행동: 그 빵을 한 덩어리 주시겠습니까?

이것이 뇌가 단계적으로 작동하는 방식입니다. 인공 신경망도 비슷한 방식으로 작동합니다. 신경망은 다양한 정보 입력을 처리하고 이를 기반으로 결정을 내리는 다층 접근 방식을 시뮬레이션하려고 합니다.

세포 또는 개별 신경 세포 수준에서 기능은 미세하게 조정됩니다. 신경 세포은 뇌의 신경 세포입니다. 신경 세포에는 수상 돌기로 알려진 미세한 확장이 있습니다. 이 확장된 세포는 신호를 수신한 다음 세포체로 전송합니다. 세포체는 자극을 처리하고 네트워크의 다른 신경 세포에 신호를 트리거하기로 결정합니다. 그렇게 하기로 결정하면 축삭으로 알려진 세포체의 확장이 화학 전달을 통해 신호를 다른 세포로 전달합니다. 신경망의 작동은 우리 뇌의 신경 세포 기능에서 영감을 얻었지만, 기술적 작용 메커니즘은 생물학적 메커니즘과 다릅니다.

하이퍼컨버지드 분석: 몰입, 스마트 및 실시간
하이퍼컨버지드 분석: 몰입, 스마트 및 실시간
하이퍼컨버지드 분석을 통해 인사이트 생성을 가속화하고 비즈니스 결과를 개선합니다.

신경망이 인간 두뇌와 유사한 기능을 하는 방법

가장 기본적인 형태의 인공 신경망에는 3개의 신경 세포 레이어가 있습니다. 정보는 인간의 두뇌에서와 마찬가지로 한 곳에서 다른 곳으로 흐릅니다.

  • 입력 계층: 시스템에 대한 데이터의 진입점
  • 은닉층: 정보가 처리되는 곳
  • 출력 계층: 시스템이 데이터를 기반으로 진행 방법을 결정하는 곳

더 복잡한 인공 신경망에는 여러 레이어가 있으며 일부는 숨겨져 있습니다.

신경망은 인공 신경 세포처럼 노드 또는 연결된 단위의 모음을 통해 작동합니다. 이 노드는 동물 뇌의 신경 세포 네트워크를 느슨하게 모델링합니다. 인공 신경 세포는 생물학적 대응물과 마찬가지로 자극 형태의 신호를 받아 처리하고 연결된 다른 신경 세포에 신호를 보냅니다.

그러나 유사점은 이것뿐입니다.

인공 신경망의 신경 작용

인공 신경망에서 인공 신경 세포는 실수인 신호의 형태로 자극을 받습니다. 그런 다음 다음을 처리합니다.

  • 각 신경 세포의 출력은 입력 합계의 비선형 함수로 계산됩니다.
  • 신경 세포 간의 연결을 엣지라고 합니다.
  • 신경 세포과 엣지 모두 가중치가 있습니다. 이 매개변수는 학습이 진행됨에 따라 조정 및 변경됩니다.
  • 가중치는 연결에서 신호의 강도를 높이거나 낮춥니다.
  • 신경 세포에는 임계값이 있을 수 있습니다. 집계 신호가 이 임계값을 초과하는 경우에만 신호가 전송됩니다.

앞서 언급했듯이 신경 세포는 레이어로 집계됩니다. 다른 레이어는 입력에 대해 다른 수정을 수행할 수 있습니다. 신호는 위에서 논의한 방식으로 첫 번째 레이어(입력 레이어)에서 마지막 레이어(출력 레이어)로 이동하며, 때로는 레이어를 여러 번 통과한 후 이동합니다.

신경망에는 자라나는 어린이가 동물의 예에서 동물을 인식하는 법을 배우는 것과 마찬가지로 주어진 입력 패턴에 따라 신경 연결의 가중치를 수정하는 일종의 학습 규칙이 본질적으로 포함되어 있습니다.

신경망 및 딥 러닝

딥 러닝을 언급하지 않고 서는 신경망에 대해 이야기하는 것이 불가능합니다. "신경망"과 "딥 러닝"이라는 용어는 서로 다르지만 종종 같은 의미로 사용됩니다. 그러나 둘은 하나가 다른 하나에 의존하여 작동하기 때문에 밀접하게 연결되어 있습니다. 신경망이 존재하지 않았다면 딥 러닝도 없었을 것입니다.

  • 딥 러닝은 이미 최전선에 있는 인공 지능(AI)의 최첨단을 형성합니다.
  • 딥 러닝은 컴퓨터가 데이터를 처리하고 학습하도록 설계된 머신 러닝과 다릅니다.
  • 딥 러닝을 통해 컴퓨터는 데이터를 처리하고, 데이터에서 학습하고, 더 많은 기능을 구축하도록 지속적으로 스스로를 훈련합니다. 더 복잡한 인공 신경망의 여러 계층이 이를 가능하게 합니다.
  • 복잡한 신경망은 단순한 형태의 신경망과 마찬가지로 입력 계층과 출력 계층을 포함하지만 여러 개의 은닉 계층도 포함합니다. 따라서 이를 심층 신경망이라고 하며 딥 러닝에 도움이 됩니다.
  • 딥 러닝 시스템은 스스로 학습하고, 모든 복잡성을 지닌 인간의 두뇌와 유사한 방식으로 여러 은닉층을 통해 정보를 필터링하여 진행하면서 더 "지식"이 됩니다.

딥 러닝이 조직에 중요한 이유

딥 러닝은 기술 세계의 새로운 골드 러시 또는 최신 석유 발견과 같습니다. 딥 러닝의 잠재력은 기존의 거대 기업과 신생 기업 및 그 사이의 모든 기업의 관심을 불러일으켰습니다. 이유는 무엇일까요?

특히 빅 데이터의 중요성이 높아짐에 따라 데이터 중심의 큰 그림의 일부입니다. 인터넷에서 파생된 데이터를 데이터베이스, 데이터 웨어하우스, 데이터 레이크에 저장되어 다양한 데이터 분석 도구로 드릴되기를 기다리는 원유라고 생각하면 딥러닝은 원유 데이터를 사용자가 사용할 수 있는 최종 제품으로 변환하는 정유 회사입니다.

딥 러닝은 데이터의 온상 위에 놓인 분석 도구로 가득 찬 시장에서 최종 게임입니다. 효율적인 최첨단 처리 장치 없이는 가치 있는 것을 추출하는 것이 불가능합니다.

딥 러닝은 반복적인 작업을 자동화하여 인간을 대체할 가능성이 있습니다. 그러나 딥 러닝은 딥 러닝 애플리케이션을 만들고 유지 관리하는 인간 과학자나 엔지니어의 사고 과정을 대체할 수 없습니다.

머신 러닝과 다른 종류의 학습 구분하기

머신 러닝

머신 러닝 방법에 관해서는 선형 회귀, K-평균, 의사 결정 트리, 랜덤 포레스트, K-최근접 이웃(KNN) 알고리즘 및 지원 벡터 머신 또는 SVM 알고리즘과 같은 학습 알고리즘을 훈련하는 것이 전부입니다.

이러한 알고리즘은 데이터 세트를 살펴보고 새로운 상황에 적응하고 흥미롭고 통찰력 있는 데이터 패턴을 찾기 위해 학습합니다. 데이터는 이러한 알고리즘이 최상의 상태로 작동하기 위한 핵심 기반입니다.

지도 학습

머신 러닝 훈련에 사용되는 데이터 세트에는 레이블을 지정할 수 있습니다. 데이터 세트에는 정답을 컴퓨터에 알려주는 답안지가 함께 제공됩니다. 예를 들어 받은 편지함에서 스팸을 검색하는 컴퓨터는 레이블이 지정된 데이터 세트를 참조하여 어떤 이메일이 스팸이고 어떤 이메일이 합법적인지 파악할 수 있습니다. 이것을 지도 학습이라고 합니다. 지도 회귀 또는 분류는 선형 회귀 및 K-최근접 이웃 알고리즘을 통해 수행됩니다.

비지도 학습

데이터 세트에 레이블이 지정되지 않고 K-평균과 같은 알고리즘이 사용되어 참조 시트의 이점 없이 클러스터 패턴을 집계하도록 지시되는 경우 이를 비지도 학습이라고 합니다.

신경망 및 퍼지 논리

이와는 별도로, 신경망과 퍼지 논리를 구별하는 것도 중요합니다. 퍼지 논리를 사용하면 부정확하거나 모호한 데이터를 기반으로 구체적인 결정을 내릴 수 있습니다. 반면 신경망은 먼저 수학적 모델을 설계하지 않고 문제를 해결하기 위해 인간과 같은 사고 프로세스를 통합하려고 합니다.

신경망은 기존 컴퓨팅과 어떻게 다릅니까?

인공 신경망에서 컴퓨팅이 작동하는 방식을 더 잘 이해하려면 기존의 "직렬" 컴퓨터와 소프트웨어 프로세스 정보를 이해해야 합니다.

직렬 컴퓨터에는 데이터와 명령이 저장된 메모리 위치의 배열을 처리할 수 있는 중앙 프로세서가 있습니다. 프로세서는 메모리 주소 내에서 명령어와 명령어에 필요한 모든 데이터를 읽습니다. 그런 다음 명령이 실행되고 결과가 지정된 메모리 위치에 저장됩니다.

직렬 시스템 또는 표준 병렬 시스템에서 계산 단계는 결정적이며 순차적이며 논리적입니다. 또한 주어진 변수의 상태를 한 작업에서 다른 작업으로 추적할 수 있습니다.

신경망의 작동

대조적으로, 인공 신경망은 순차적이거나 반드시 결정적이지 않습니다. 여기에는 복잡한 중앙 프로세서가 포함되어 있지 않습니다. 대신 다른 프로세서에서 입력의 가중치 합계를 취하는 몇 개의 간단한 프로세서로 구성됩니다.

신경망은 프로그래밍된 명령을 실행하지 않습니다. 그것들은 제공된 입력 패턴에 병렬로(시뮬레이션된 방식으로 또는 실제 방식으로) 응답합니다.

신경망은 데이터 저장을 위한 별도의 메모리 주소를 포함하지 않습니다. 대신 정보는 네트워크의 전체 활성화 상태에 포함됩니다. 지식은 네트워크 자체로 표현되며, 이는 문자 그대로 개별 구성 요소의 합보다 더 많습니다.

기존 기술에 비한 신경망의 장점

신경망은 관계가 동적이거나 비선형인 문제의 경우 매우 효율적으로 자가 훈련할 것으로 예상할 수 있습니다. 이 능력은 내부 데이터 패턴이 강하면 더욱 향상됩니다. 또한 어느 정도 응용 프로그램 자체에 따라 다릅니다.

신경망은 선형성, 정규성 및 변수 독립성의 엄격한 가정과 같은 아이디어로 다소 제한된 표준 기술에 대한 분석적 대안입니다.

다양한 관계를 조사하는 신경망의 능력은 사용자가 다른 방법으로는 이해하기 매우 어렵거나 심지어 불가능했을 수 있는 현상을 보다 쉽게 신속하게 모델링할 수 있도록 지원합니다.

당신은 어떤 데이터 사이언스 슈퍼 히어로인가요?
당신은 어떤 데이터 사이언스 슈퍼 히어로인가요?
이 전자 책을 다운로드하여 데이터 사이언티스트로서 차별화되는 데 필요한 여섯 가지 주요 기술을 알아보십시오.

신경망의 한계

특히 역전파 신경망 및 기타 특정 유형의 네트워크와 관련하여 잠재적인 사용자가 알고 있어야 하는 몇 가지 특정 문제가 있습니다.

설명할 수 없는 프로세스

역전파 신경망은 궁극의 블랙박스라고 불립니다. 일반적인 아키텍처를 설명하고 일부 난수를 시드로 사용하는 것 외에도 사용자가 해야 할 일은 입력을 제공하고 계속 교육한 다음 출력을 수신하는 것입니다. 일부 소프트웨어 패키지를 사용하면 사용자가 시간이 지남에 따른 네트워크 진행 상황을 샘플링할 수 있습니다. 이러한 경우 학습은 자체적으로 진행됩니다.

최종 출력은 자체 내부 수학 너머의 관계를 정의하는 방정식이나 계수를 제공하지 않는다는 점에서 자율적인 훈련된 네트워크입니다. 네트워크 자체는 관계의 최종 방정식입니다.

학습 속도가 느림

또한 역전파 네트워크는 다른 유형의 네트워크보다 학습 속도가 느린 경향이 있으며 때로는 수천 시대를 필요로 합니다. 이것은 기계의 중앙 처리 장치가 각 노드와 연결의 기능을 별도로 계산해야 하기 때문입니다. 이것은 매우 성가시고 방대한 양의 데이터를 포함하는 초대형 네트워크에서 문제를 일으킬 수 있습니다. 그러나 현대 기계는 이 문제를 피할 수 있을 만큼 충분히 빠르게 작동합니다.

신경망의 응용

신경망은 보편적인 근사기입니다. 시스템이 오류에 대한 내성이 높을 때 가장 잘 작동합니다.

신경망은 다음의 경우 유용합니다.

  • 연관을 이해하거나 패턴 세트 내에서 규칙적인 요소를 발견하려는 경우
  • 데이터의 양이나 매개변수의 다양성이 엄청난 경우
  • 변수 간의 관계 이해가 모호한 경우
  • 기존 접근 방식이 관계를 설명하는 데 부족한 경우

생물학에서 영감을 받은 이 우수한 패러다임은 우리 시대의 가장 우아한 기술 발전 중 하나입니다.