ROBOT@qwh 第2页 - 人工智能机器人技术网

CIFAR-10--人工智能数据集

由 Krizhevsky 等人提出。从微小图像中学习多层特征CIFAR -10数据集（加拿大高级研究所，10 个类别）是 Tiny Images 数据集的子集，由 60000 张 32x32 彩色图像组成。这些图像标有 10 个相互排斥的类别之一：飞机、汽车（但不是卡车或皮卡车）、鸟、猫、鹿、狗、青蛙、马、船和卡车（但不是皮卡车）。每类有 6000 张图像，每类有 5000 张训练图像和 1000 张测试图像。判断图像是否属于某个类的标准如下：类名应该位于“这张图片...
作者：ROBOT@qwh 日期：2023.11.13 分类：人工智能 327
什么是小样本学习？

小样本学习是指使用极少量的训练数据来开发人工智能模型的各种算法和技术。少样本学习致力于让人工智能模型在接触相对较少的训练实例后识别和分类新数据。少样本训练与训练机器学习模型的传统方法形成鲜明对比，传统方法通常使用大量训练数据。小样本学习主要用于计算机视觉。为了对小样本学习有更好的直觉，让我们更详细地研究这个概念。我们将研究少样本学习背后的动机和概念，探索一些不同类型的少样本学习，并涵盖高层少样本学习中使用的一些模型。最后，我们将研究一些小样本学习的应用程序。什么是小样本学习？...
作者：ROBOT@qwh 日期：2023.11.07 分类：人工智能 380
DevOps 中的 AI：简化软件部署和运营

就像一台运转良好的机器一样，您的组织正处于重大软件部署的边缘。您已经在尖端人工智能解决方案上投入了大量资金，您的数字化转型战略已经制定，并且您的目光坚定地瞄准了未来。然而，问题迫在眉睫——您能否真正利用人工智能的力量来简化软件部署和运营？到 2027 年，全球数字化转型市场规模将达到惊人的15,489 亿美元，复合年增长率为 21.1%，您不能只是原地踏步。随着新兴的DevOps 趋势重新定义软件开发，公司利用先进的功能来加速人工智能的采用。这就是为什么，您需要拥...
作者：ROBOT@qwh 日期：2023.11.01 分类：人工智能 365
Zero123++：从单张图像推理出多个视图模型

Zero123++，这是一种图像条件扩散模型，用于从单个输入视图生成 3D 一致的多视图图像。为了充分利用预训练的 2D 生成先验，我们开发了各种条件和训练方案，以最大限度地减少现成图像扩散模型（例如稳定扩散）的微调工作。Zero123++ 擅长从单个图像生成高质量、一致的多视图图像，克服纹理退化和几何错位等常见问题。此外，我们展示了在 Zero123++ 上训练 ControlNet 以增强对生成过程的控制的可行性。 ...
作者：ROBOT@qwh 日期：2023.10.25 分类：人工智能 478
现代机器人I - 手臂式机械手(教程)

Modern Robotics I - Arm Type ManipulatorsYou can watch a video of the introduction to the Modern Robotics I course at the link below:Introduction to the Course VideoDownload the full syllabus of the course including grading criteria at the...
作者：ROBOT@qwh 日期：2023.10.24 分类：学习教程 391
机器人烹饪方法YORI

由加州大学洛杉矶分校的机器人与机械实验室一直在研究，既利用机器人友好的自动化，又利用人类技能，使事物味道正确，的烹饪机器人解决方案。论文链接：https://spectrum.ieee.org/romela-cooking-robot...
作者：ROBOT@qwh 日期：2023.10.17 分类：机器人 680
在音频中将你的描述和内容分开模型AudioSep

语言查询音频源分离（LASS）是计算听觉场景分析（CASA）的新范例。LASS 旨在根据自然语言查询从音频混合物中分离出目标声音，这为数字音频应用程序提供了自然且可扩展的接口。最近的 LASS 工作尽管在特定源（例如乐器、有限类别的音频事件）上取得了有希望的分离性能，但无法在开放域中分离音频概念。在这项工作中，我们介绍了 AudioSep，这是一种使用自然语言查询进行开放域音频源分离的基础模型。我们在大规模多模态数据集上训练 AudioSep，并广泛评估其在音频事件分离、乐器...
作者：ROBOT@qwh 日期：2023.10.16 分类：项目 1173
OpenAI考虑加入AI芯片制造联盟

OpenAI是著名的ChatGPT背后的强大力量，可能很快就会深入研究人工智能芯片制造的动态世界。根据路透社的一份新报道，该公司正在积极考虑创建其独特的AI芯片，甚至正在考虑收购该领域的潜在目标。全球对AI芯片的需求正在飙升，尤其是在OpenAI的ChatGPT去年冲击市场之后。这种被称为AI加速器的专用芯片在培训和实施尖端的生成AI技术方面发挥着关键作用。目前，市场认为英伟达处于顶峰，在大多数AI芯片生产中占据主导地位。OpenAI对这些昂贵的芯片的依赖也是有限的，这使该公...
作者：ROBOT@qwh 日期：2023.10.12 分类：人工智能 281
重新定义机器人技术：普渡大学的创新机器视觉解决方案

受人尊敬的普渡大学的研究人员在机器人、机器视觉和感知领域取得了重大飞跃。他们的突破性方法比传统技术有了显着的改进，有望在未来机器比以往任何时候都更有效、更安全地感知周围环境。介绍HADAR：机器感知的革命性飞跃Elmore电气和计算机工程副教授Zubin Jacob与研究科学家Fanglin Bao合作，介绍了一种名为HADAR的开创性方法，是热辅助检测和测距的缩写。他们的创新引起了极大的关注，这种认可扩大了人们对HADAR在各个领域的潜在应用的预期。传统上，机器感知依赖于激...
作者：ROBOT@qwh 日期：2023.10.12 分类：机器人 293
与大型语言模型和机器人相关的资源、文章和观点列表

我们收集了一些与大型语言模型（LLM）相关的文章，观点，视频和资源。其中一些链接还涵盖了其他生成模型。我们将定期更新此列表，以添加任何其他感兴趣的资源。本文是该系列的第三篇。（以前的版本在这里：v1 |v2.）什么是法学硕士以及它们是如何工作的什么是生成AI模型？，Kate Soule，来自IBM Technology的视频。大型语言模型简介，John Ewald，来自Google Cloud Tech的视频。什么是 GPT-4，它与 ChatGPT 有何不同？，A...
作者：ROBOT@qwh 日期：2023.10.10 分类：人工智能 989