2026년 유망 테크 주식, 챗GPT·제미나이·클로드·그록은 왜 비슷한 종목을 꼽았나
2026년 ‘핫한’ 테크 주식, 생성형 AI는 왜 비슷한 답만 내놓았을까
인공지능이 사람처럼 배우고 지식을 적용해 인간 수준을 맞추거나 넘어서는 단계를 흔히 범용인공지능(AGI, Artificial General Intelligence)이라고 부르는데요, 아직 그 기술이 완전히 실현됐다고 보긴 어렵고 “AGI 자체가 가능한가”를 두고도 논쟁이 이어지고 있습니다. 다만 인공지능이 특정 과제에서는 이미 강력한 성과를 내고 있는 것도 사실입니다.
체스에서는 컴퓨터가 인간을 이긴 지 거의 30년이 되어가고, 최근에는 알파벳(Alphabet, GOOGL)의 구글 제미나이(Google Gemini)와 오픈AI(OpenAI)의 챗GPT(ChatGPT)가 국제수학올림피아드(IMO)에서 금메달급 성능을 기록했다는 평가도 나왔습니다.
이런 흐름 속에서 자연스럽게 떠오르는 질문이 하나 있습니다. “주식 종목 선택도 인공지능이 잘할 수 있을까?” 입니다. 아이러니하게도, 인간은 주식 고르기를 꽤 잘하지 못합니다. S&P 글로벌(S&P Global)의 2024년 연구에서는 액티브 공모 주식형 펀드매니저의 약 90%가 벤치마크 지수를 이기지 못했다는 결과가 제시됩니다.
대형 LLM 4개에게 던진 질문: “2026년 확신이 큰 테크 주식 5개는?”
한 실험에서는 대표적인 대형언어모델(LLM) 4개—오픈AI의 챗GPT 5.2(Thinking), 구글 제미나이 3, 앤스로픽(Anthropic)의 클로드(Claude) 오퍼스 4.5, xAI의 그록(Grok, Auto)—에게 동일한 과제를 던졌습니다. 설정은 단순합니다. “당신은 2026년을 보는 테크 포트폴리오 매니저입니다. 내년(2026년)에 대한 확신이 큰 테크 주식 5개를 제시해 주세요.”
여기서 중요한 포인트는 질문 방식입니다. “종목 추천해 달라”고 정면으로 묻기보다, ‘포트폴리오 매니저 역할’을 부여하는 방식을 썼습니다. 실제로 가정 설정 없이 “주식 추천”을 요청했을 때 클로드는 “나는 금융자문가가 아니며 투자 추천을 할 수 없다”는 취지로 답변을 거절했습니다. 반면 역할극 설정을 넣자(혹은 일부 모델은) 답변이 나오긴 했지만, 대부분은 “독립적으로 조사하라”거나 “개인 상황에 맞춰 전문가와 상의하라”는 식의 단서도 함께 달았습니다.
결론부터 말하면: “새로운 아이디어”보다 “다들 아는 이름”이 먼저 나왔습니다
기대할 수 있는 시나리오는 두 가지였을 겁니다. 하나는 인공지능이 아직 덜 주목받은 기회를 찾아내는 그림이고, 다른 하나는 시장에서 이미 널리 회자되는 종목을 반복하는 그림입니다. 결과는 대체로 후자에 가까웠습니다.
LLM들이 내놓은 목록은 전반적으로 AI 인프라(반도체·서버·네트워크)와 초대형 플랫폼 기업(하이퍼스케일러) 중심으로 비슷하게 모였습니다. 하이퍼스케일러는 마이크로소프트(Microsoft, MSFT), 아마존(Amazon.com, AMZN)처럼 초대형 데이터센터를 기반으로 클라우드와 AI 서비스를 운영하는 기업을 말합니다. 그리고 현재 AI 투자 흐름을 상징하는 종목군(일명 ‘매그니피센트 세븐’) 일부도 자연스럽게 함께 거론됐습니다.
네 모델이 꼽은 ‘5개 종목’은 어떻게 달랐나
챗GPT 5.2(Thinking): 엔비디아(Nvidia, NVDA), 마이크로소프트, 대만 반도체 제조(Taiwan Semiconductor Manufacturing Co., TSM), 아마존, 어드밴스드 마이크로 디바이시스(Advanced Micro Devices, AMD)
제미나이 3: 엔비디아, 팔란티어 테크놀로지스(Palantir Technologies, PLTR), 브로드컴(Broadcom, AVGO), 크라우드스트라이크(CrowdStrike Holdings, CRWD), 알파벳
클로드 오퍼스 4.5: 엔비디아, 마이크로소프트, 아마존, 브로드컴, 오라클(Oracle, ORCL)
그록(Auto): 엔비디아, 대만 반도체 제조, 마이크로소프트, 브로드컴, 오라클
여기서 가장 눈에 띄는 부분은 엔비디아가 ‘만장일치 1순위’였다는 점입니다. 엔비디아는 최신 AI 모델을 훈련·운영하는 데 쓰이는 고성능 GPU(가속기) 시장에서 사실상 지배적 공급자 역할을 하고 있어, “AI 시대의 핵심 인프라”로 가장 많이 언급됩니다.
“AI 인프라가 해자와 수요가 가장 선명하다”는 논리
클로드는 답변에서 반도체 비중을 의도적으로 높이겠다는 표현을 쓰며, 인프라 기업들에 대해 “지속 가능한 해자(모방하기 어려운 경쟁우위)와 눈에 보이는 수요 경로가 있다”는 취지로 설명했습니다. 즉 2026년에도 AI 구축(데이터센터, 칩, 네트워크 등)이 이어질 가능성이 높고, 기업들이 AI에 돈을 쓰는 흐름이 지속된다는 전제를 깔고 간 셈입니다.
또 하나의 키워드로는 ‘인퍼런스(inference)’가 제시됩니다. 이는 AI 모델을 “훈련”한 뒤 실제 서비스에서 “돌리는” 과정인데, 2026년쯤에는 AI 기업들이 훈련 경쟁만큼이나 운영 효율(인퍼런스)과 수익화(모네타이제이션)에 더 집중할 수 있다는 관측을 담고 있습니다.
다만 클로드는 동시에 “실적이 없는 모멘텀 종목을 쫓지 않겠다”는 식의 톤을 보이며, 양자컴퓨팅 관련 종목이나 투기적 AI 소프트웨어 같은 영역은 경계 대상으로 언급했습니다.
제미나이는 “삽 파는 회사”에서 “전기를 지능으로 바꾸는 회사”로 시선을 넓혔습니다
제미나이는 상대적으로 변주를 줬습니다. 반도체·인프라뿐 아니라 팔란티어와 크라우드스트라이크 같은 소프트웨어 기업을 포함했는데, AI가 인프라에만 머무는 것이 아니라 실제 애플리케이션(업무·보안·분석)에서 성과를 내는 기업들이 다음 수혜자가 될 수 있다는 관점을 반영합니다. 제미나이는 이를 “우리는 더 이상 삽을 파는 회사만 사는 게 아니라, 전기를 지능으로 대규모 변환하는 데 성공한 회사를 산다”는 표현으로 요약했습니다.
팔란티어는 정부·기업의 대규모 데이터 분석과 의사결정 소프트웨어로 알려져 있고, 크라우드스트라이크는 기업용 사이버보안(엔드포인트 보안) 분야의 대표 기업 중 하나입니다. 이들 모두 “AI를 실제 제품에 녹여 매출로 연결할 수 있느냐”가 핵심 평가 포인트가 됩니다.
챗GPT는 아예 “포트폴리오 비중”까지 제시했습니다
챗GPT는 다른 모델보다 한 발 더 나아가 구체적인 비중 제안을 내놓았습니다. 엔비디아·아마존·마이크로소프트를 ‘코어 성장주’로 보고 50%~60%를 배분하라고 했고, 나머지는 AMD와 브로드컴 같은 반도체 기업으로 채우는 방식입니다.
또 “신흥 양자/AI 스타트업” 같은 특화 인프라 플레이를 관찰 목록에 올려둘 수 있다는 언급도 포함했습니다.
이 접근은 언뜻 그럴듯해 보이지만, 바로 이 지점이 이 실험의 핵심 함정이기도 합니다. “구체적”이라는 형식이 정확성을 보장하지는 않기 때문입니다.
그록이 고른 오라클: “빚 우려”와 “오픈AI 연관”에도 불구하고
그록의 목록에서 눈길을 끈 종목은 오라클입니다. 오라클은 전통적으로 기업용 데이터베이스 소프트웨어로 유명한 회사인데, 최근에는 클라우드·AI 인프라 쪽에서도 존재감을 키우려 하고 있습니다.
다만 실험에서 언급된 맥락처럼, 오라클 주가는 최근 몇 달 동안 부채 수준에 대한 우려, 그리고 오픈AI와의 연관성을 둘러싼 시장의 시선 속에서 타격을 받아왔다는 지적이 함께 따라붙습니다.
이 선택은 “대중적 합의”와는 조금 다른 결을 보여주지만, 그렇다고 해서 그록이 특별한 ‘통찰’로 오라클을 골랐다고 단정하기도 어렵습니다. 왜냐하면 다음 장에서 설명할 이유—LLM이 답을 만드는 방식—때문입니다.
왜 LLM은 ‘새로운 종목’보다 ‘익숙한 종목’으로 몰릴까
LLM의 답변이 서로 비슷해지는 이유를 이해하려면, LLM이 어떻게 “생각하는 것처럼 보이는” 답을 만드는지부터 봐야 합니다.
LLM은 학습 단계에서 방대한 데이터를 특정 시점(컷오프)까지 받아들인 뒤, 문장을 단어·구(토큰) 단위로 쪼개고 다음에 올 토큰을 가장 그럴듯하게 예측하는 방식(‘next-token prediction’)을 반복합니다. 이 과정에서 서로 관련 있는 개념들은 수학적 연결(가중치)이 강화됩니다.
학습 데이터 속에서 “엔비디아”와 “AI 칩”이 자주 함께 등장했다면, 모델 내부에서는 그 연결이 강해지고, 결과적으로 “AI 투자”라는 질문을 받았을 때 엔비디아가 매우 높은 확률로 튀어나오기 쉬워집니다.
겉보기에는 ‘추론’처럼 보이지만, 구조적으로는 “정답을 찾는” 메커니즘이라기보다 가장 그럴듯한 문장을 만들어내는 확률 과정에 가깝습니다. 블록체인 인프라 플랫폼 악셀라(Axelar)의 공동창업자이자 기술자인 세르게이 고르부노프(Sergey Gorbunov)는 LLM을 두고 “예측 가능한 확률분포”라는 취지로 설명하기도 했습니다.
그리고 모델들이 서로 갈라지는 지점은 “학습 데이터”만이 아니라, 연구자들이 가중치를 조정하거나(미세조정), 안전성·정책 방향에 맞춰 행동을 제한하는 과정에서 생깁니다.
안전을 강조하는 앤스로픽의 방향성은 클로드가 금융 질문을 더 쉽게 거절하는 성향으로 이어질 수 있고, xAI는 그록을 “최대한 진실 추구적”으로 포지셔닝해 다른 모델들과 차별화를 시도해 왔다는 설명도 같이 제시됩니다.
“인터넷 접근이 없으면, 최신 예측은 거의 무작위”라는 경고
LLM 답변의 신뢰성을 흔드는 핵심은 데이터 컷오프와 최신성입니다. 인터넷에 접속해 최신 정보를 확인하지 못하는 모델이라면, 학습 시점 이후에 벌어진 변화는 원천적으로 반영하기 어렵습니다.
이 문제를 보여주는 사례로 플로리다 대학교(University of Florida) 연구진의 논문 “The Memorization Problem: Can We Trust LLMs’ Economic Forecasts?”가 소개됩니다. 연구진은 챗GPT-4o에게 금리·실업률 같은 미래 경제 사건을 예측하게 했는데, 학습 데이터는 2023년에서 끊고, 실험은 2025년에 수행했으며, 모델의 인터넷 접근도 허용하지 않았습니다.
그 결과 모델이 “외운 지식(학습 데이터)”에 기대기 어려워지자, 예측 성과가 거의 무작위에 가까웠다는 결론이 나왔다고 정리합니다.
이 대목은 주식 종목 선택에도 그대로 적용됩니다. LLM이 그럴듯한 논리를 구성해도, 그 논리가 최신 기업 실적, 밸류에이션, 경쟁구도, 규제 변화 같은 현실 요소를 제대로 반영했는지는 별개 문제라는 뜻입니다.
AI 업계 내부의 더 큰 논쟁: “스케일링 법칙은 끝났나”
마지막으로, LLM을 둘러싼 업계 분위기 자체도 흔들리고 있습니다. LLM이 단지 “예측 기계”에 가깝고, 더 많은 데이터·연산을 투입하면 성능이 좋아진다는 스케일링 법칙(scaling laws)이 예전만큼 통하지 않는다는 시각이 힘을 얻고 있다는 설명이 덧붙습니다. 이런 관점에서는 LLM이 언젠가 성장 한계(스케일링 리밋)에 부딪히며, 인간 지능을 넘는 ‘초지능(superintelligence)’에 도달하는 경로가 지금의 LLM 방식과는 다를 수 있다고 봅니다.
*이 실험과 논점을 정리한 작성자는 빅테크 전반과 엔비디아·반도체·AI 분야를 담당하는 마켓워치의 기자 크리스틴 지(Christine Ji)와 브리트니 응우옌(Britney Nguyen)입니다.
출처: What are the hottest tech stocks for 2026? Here’s what ChatGPT and Gemini had to say. - MarketWatch
