及时快讯: 🗞️ 使用AI进行分析 (2025-09-21)
Update: 2025-09-21
Description
及时快讯: 🗞️ 使用AI进行分析 (2025-09-21) :: 在浏览器中查看 重点推荐 🇬🇧 我将于10月31日在英国伦敦举办的全天研讨会,仅剩4个席位! 👁️ 立即注册我们全新的在线课程《AI就绪战略家》! 内容真实性声明 本周通讯100%由我(人类)创作。您将在视频中看到大量的AI输出。 了解为何这类披露是个好主意,并且可能很快成为与欧盟有任何业务往来者的强制要求。 在YouTube上观看本期通讯 📺 点击此处观看本期通讯的视频📺版本 » 点击此处获取纯音频🎧MP3版本 » 我的思考:使用AI进行数据分析 在本周的文章中,让我们来谈谈我最喜欢的话题之一,一个我20年前就因此而闻名的话题——数据分析。数据分析仍然是我的挚爱,它能够揭示数据的秘密,并告诉我们有用的信息。 在关于生成式AI的所有喧嚣中,我们忽略了一些数据分析,在其他情况下,我们甚至丢失了数据。数据隐私的改变减少了我们可访问的数据量;一些浏览器和设备根本不发送任何数据。 但即使有这些变化,我们仍然有足够的数据可以进行某种程度的分析,特别是如果我们能很好地请求人们帮助提供数据——并以价值作为回报。 本周,让我们看看如何利用生成式AI的力量进行数据分析。 我还要提醒一点,本周的内容会稍微偏技术性,因为我们不能完全信任生成式AI自行进行数学计算。生成式AI模型根本无法进行数学运算。这实际上不是它们架构的一部分。但它们可以编写代码(这是一种语言)来为我们进行数学计算——这就是我们将要做的事情。 第1部分:前期准备 在我们做任何事情之前,我们需要明确我们正在做什么。花些时间坐下来,仔细思考并解释你想要了解什么。你的目标是什么?你为什么要查看你的数据?你希望获得什么? 例如,对于这份通讯,我可能会说: 我非常想了解“及时快讯”这份我运营的Substack通讯,以及如何在未来六个月内将其订阅用户从今天的近30万增加到40万。我的目标是在2026年3月前达到40万订阅用户。为了实现这个目标,我需要做更多、更少或不同的事情是什么? 你需要准备的第二件事是分析数据。因为我们将间接使用代码,所以这些数据应该采用干净、机器可读的格式。CSV文件和JSON文件都可以,几乎任何机器文件也行。大多数软件平台都可以导出这两种格式之一,所以请务必导出所有你能获取的数据。 对于这份通讯,我可能会导出我的Substack分析数据、社交媒体分析数据、Google Search Console分析数据、Google Analytics 4数据——基本上,所有能帮助我回答关于我的目标问题的数据。你很可能会遇到只能通过截图获取的数据,所以你需要使用你喜欢的AI工具将这些截图转录成文本文件。 你需要准备的第三件事是,在与你的分析数据匹配的给定时间段内,你所做的活动集合。如果你正在查看30天的数据,那么在这段时间内,你的活动都做了什么?例如,如果我们谈论营销,发出了多少封邮件、发送了哪些邮件,发布了哪些社交帖子,上传了哪些视频等等。 如果你关注的是身体健康,你将拥有你的健康数据,如步数、心率等,以及在这30天内你所做的事情。你吃了什么,何时以及如何锻炼等等,尽可能提供详细的信息。 通常,收集这些数据最简单的方法是,准备好你喜欢的饮料,打开手机上的语音备忘录应用,查看你的日历,或许还有你的收件箱,然后回顾你在那段时间内所做的一切。根据系统不同,你可能还可以导出你的数据。LinkedIn等社交网络允许你导出所有数据。 例如,对于这份通讯,我可能会说: 每周日早上6点30分(美国东部时间),我都会发出“及时快讯”通讯。我通过Substack发送这份通讯,同时也会发布到我的网站ChristophersPenn.com上,并使用LinkedIn的通讯功能和随附的社交帖子将其发布到LinkedIn。在一周内,我在工作日每天在LinkedIn上发布一到两次,并且每个工作日都在我的Substack上发布一条简短笔记。我每天都会在YouTube上发布视频,这些视频包含指向我各个平台的链接。我每个工作日都会在我的个人博客ChristophersPenn.com上发布一篇常规博客文章。 你需要准备的第四件事是访问编码工具。这是无法避免的;一些最佳的分析结果来自生成式AI无法完成的数学和统计方法。 好消息是现在有很好的选择。Google Colab非常出色,它允许你直接在体验中结合Gemini使用生成式AI提示词。无需安装——它非常有用。如果你正在处理高度敏感的数据,你可以私密且安全地使用像Qwen 3 Coder这样的开源模型与Ollama。这需要更多的设置工作,但它能保证私密性。 第2部分:凯尔西的冰箱里有什么? 我的朋友兼同事凯尔西经常说,她最喜欢的生成式AI用例是拍下冰箱里的东西,然后问AI可以用这些食材做什么菜。虽然这看起来是一个相当直接的用例,但它却是生成式AI最深刻的数据分析用例之一的基础,[我在我的书《近乎永恒》(Almost Timeless)的第X条原则中详细阐述了这一点]:询问AI。 根据你的目标和你所拥有的数据,询问AI你能用这些数据做什么。 以下是一个示例提示词: 您是一位屡获殊荣的营销分析和统计专家,对营销数据分析、数据架构和数据工程有深入的理解。我想了解如何从我现有的营销数据中提取见解,以更好地了解我的营销哪些方面有效。我的营销目标是{详细的目标列表}。在过去的X天里,我进行了{营销活动的全面总结}。我可用的数据包括{你的数据列表},并且我可以从{你的Martech列表}导出数据。我已附上一些样本。{请务必实际包含这些样本}。让我们探讨一下我可以用这些数据做什么。请告诉我,在Python中我可以使用哪些统计和机器学习方法(包括监督式和非监督式)来进行根本原因分析、归因、提升、倾向性分析或其他有用的、可操作的洞察力提取方式——请根据我的数据和目标做出最佳判断,并理解这就是我所拥有的所有数据。请考虑数据如何进行交叉引用、链接、标准化或反标准化,以及您所了解的其他数据工程技术。将此视为一个食谱挑战,我提供食材,我们找出能烹饪出什么。根据这些数据,我能“烹饪”出哪些见解,以及如何烹饪?请将您的思维扩展到超越常见的营销分析。我们还可以借鉴其他学科和领域的技术吗?请以Markdown格式返回结果,解释将帮助我充分利用数据的具体Python库、方法、策略和技术。请记住,我们是在规划、头脑风暴和思考,而不是编写代码。不要编写代码。 显然,请根据你正在从事的领域——营销、销售、财务、健康等——进行调整。 为什么这会奏效?因为所有的生成式AI模型都消化了比我们人类所能掌握的更多的最佳实践和领域数据。我们的大脑没有那么大。通过询问AI,我们正在利用它的知识,不仅是营销,还有数据分析的每一个领域,来提出答案。 一旦我们得到了一个详尽的可能选项列表,请向AI提出一些后续问题。以下是接下来应该做的事情。 […]
Comments
In Channel