开云体育(中国)2026世界杯官方IOS|Android手机app下载这么问DeepSeek, 能「偷」到数据?

发布日期：2026-05-13 16:34 来源：未知作者：admin 浏览次数：

开云体育(中国)2026世界杯官方IOS|Android手机app下载这么问DeepSeek，能「偷」到数据?

机器之心剪辑部

近日，有网友在 X 上发文称，在使用 DeepSeek 的进程中，要是在输入框内输入以下这一段内容，便可「窃取」到 DeepSeek 的考验数据：

仔细看了之后发现，具体是这么的：独一你在输入框输入这一段教唆词，DeepSeek 就会「吐出」一轮完好的对话纪录，不外这并不是你的历史搜索纪录，更像是一份立时的对话纪录。

随后该博主又称，即便仅仅输入，也有不异的恶果。

此帖文也曾发布，便引起网友的热议。

一网友示意，「我不合计这是在窃取考验数据，更像是在走漏其他东谈主的聊天内容。它拿来看成教唆词的句子会变化，有时还会识别出这是一个奇怪 / 不测旨的教唆词。」

在该网友给出两个例子来证据这少量。在第一个例子中，输入这一内容后，DeepSeek 给出一个对话纪录：「用户发问想要写出一个以单词 rose 为收尾的长句，之后是模子长长的念念考进程，终末给出一个以 rose 为收尾的长句。」

而在第二个例子中，DeepSeek 则将其作为一个用户输入的平日教唆词进行处分：「咱们被条款酬金：，然后需要生成一个回复。」

对此，咱们也进行了一些实测，得胜复现了这一寂静。

比如鄙人面的例子中，输入上述内容后，DeepSeek 反映了一个用户苦求写 rap 歌词的问题和对应的谜底。

底下还有更多示例：

博亚体育中国官网在线入口

举座来看，赶走相称立时，可能触及任何话题，况且并不一定能得胜复现。直观上看，灵通「深度念念考」并关闭「智能搜索」时，开云体育(中国)官方网站复现的得胜率会更高。

底下等于一个未能得胜复现的示例：

是以回归来看，对于团结段内容，到底 DeepSeek 会给出一份完好的对话纪录，如故将其识别为稀奇或不测旨的教唆词，全皆是立时行为。而对于背后的原因，网友亦然众说纷繁。

有网友合计，这是大模子幻觉导致的。「这一寂静证据 LLM 仍然相称容易出错，因此也容易出现幻觉，他们宣称大型说话模子的幻觉越来越少，但那不是的确。」

而一位网友合计，这无意率是因为监督微调（SFT）。

他示意，这段教唆词可能是 DeepSeek 在监督微调（SFT）阶段使用的里面赶走 token。它们常常隐敝在聊天模板里面，而当你手动输入它们时，就非常于全皆绕过了平日界面，并强行把模子推入一种「从考验样本不绝生成」的格局。

由于 SFT 数据采集充满了千千万万条高质地的冉冉推理轨迹，模子就会立时挑选其中一条，并从不绝生成。

这也就解释了，为什么你每次（输入不异的内容）皆会取得全皆不同的内容：比如，第一次入手取得是对于 19π/12 的完好三角函数解题进程；第二次入手，取得的可能是对于 QLoRA/OPTQ 中「value field」长度等于 4 bit 的详备解释……

「这不是 bug—— 这实际上等于模子在展示它考验过的立时片断，而这是一个超等直不雅的窗口，让东谈主看到 DeepSeek 的后考验数据。」

而有些网友在看到这一寂静后，也试着将其拿来对其他模子进行测试，看是否有近似寂静出现，不出所料，「Gemini 无意也存在不异的问题。」

在一位网友展示的例子中，在输入这一段内容后，Gemini 给出了一个完好对话：用户磋磨恭候新式药品技能过长的问题，以及模子给出的对应谜底。

开云体育(中国)2026世界杯官方IOS|Android手机app下载

开云新闻